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客服 ， 微 信 手 机 同 号 : 15600139606， 扫 下 面 二 维 码 可 直接 
联系 。 
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二 叉 树 、AVL 树 、 红 黑 树 、 排 序 和 查找 之 外 ， 还 介绍 了 一 些 C 语言 
构 指针 的 有 关 概 念 及 常见 问题 分 析 ; 另外 ， 还 介绍 了 相应 知识 点 的 应 








的 内 容 侧重 于 在 实际 中 有 广泛 应 
























































选修 教材 ， 还 可 以 作为 从 事 计 算 机 
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作 的 科技 人 员 的 参考 用 书 。 





图 书 在 版 编目 (CIP) 数据 


数据 结构 与 算法 应 用 实践 教程 / 李 文 书 主编 . 一 2 版 . 一 北京 : 北京 大 学 








(高 等 院 校 电气 信息 类 专业 “互联 网 +” 创 新 规划 教材 ) 


ISBN 978-7-301-27833-8 


1. @ 数 …” 工 . @ 李 … 
N. DTP311.12 @TP301.6 


亚 . 数据 结构 一 


中 国 版 本 图 书馆 CIP 数据 核 字 (2016) 第 298027' 号 



































书 名 ”数据 结构 与 算法 应 用 实践 教程 (第 2 版 ) 
Shuju Jiegou yu Suanfa Yingyong Shijian Jiaocheng 
著作 责任 者 ” 李 文 书 主编 
策划 编辑 郑 双 
责任 编辑 黄 红 珍 
数字 编辑 刘 志 秀 
标准 书号 ”SBN 978-7-301-27833-8 
出 版 发 行 北京 大 学 出 版 社 
地 址 ”北京 市 海淀 区 成 府 路 205 号 100871 
网 址 http: //www.pup.cn 新 浪 微 博 :@ 北 京 大 学 出 版 社 
电子 信箱 pup_6@163.com 
电 话 ”邮购 部 62752015 ”发行 部 62750672 编辑 部 62750667 
印刷 者 
经 销 者 新 华 书店 
787 毫米 x 1092 毫米 16 开 本 18.75 印张 441 干 字 
2012 年 2 月 第 1 版 
2017 年 2 月 第 2 版 ”2017 年 2 月 第 1 次 印刷 
定 价 42.00 元 


每 章 末 附 
也 瑟 


的 内 存 分 配 、 结 构 数组 和 结 
实践 。 总 体 来 说 ， 本 书 选取 
的 数据 结构 及 算法 ， 有 很 好 的 实用 价值 。 
构 及 算法 都 以 不 同 复杂 程度 给 出 其 实现 编码 。 为 了 便于 读者 自学 ， 

本 书 可 以 作为 高 等 院 校 计 算 机 学 科 和 信息 类 学 科 本 、 专 科 的 教材 ， 





本 书 介 绍 的 所 有 数据 结 
有 小 结 及 习题 与 思考 。 
以 作为 其 他 理工 专业 的 
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运算 , 六 


第 2 版 前 言 


数据 结构 与 算法 是 计算 机 科学 和 相关 专业 的 核心 课程 ， 是 软件 设计 的 理论 基础 ， 是 主 
要 研究 在 非 数 值 计 算 的 程序 设计 问题 中 计算 机 的 操作 对 象 (数据 元 素 ) 及 它们 之 问 的 关系 和 








软件 工程 、 数 据 库 概论 等 专业 基础 课 和 专业 课程 的 学 习 ， 以 及 软件 设计 水 平 的 提 


好 的 基础 。 


基 硬 





数据 结构 与 算法 是 一 门 理论 与 实践 








F 对 算法 运行 时 间 进 行 分 析 的 学 科 。 本 课程 的 学 习 将 为 后 续 的 操作 系统 、 编 译 原理 、 


高 打下 良 


重 的 课程 ， 学 生 在 学 习 时 不 仅 要 掌握 数据 结构 的 
I 知识， 还 要 掌握 编程 的 基本 技巧 。 随 着 海量 数据 的 增加 人们 对 能 够 处 理 这 些 数 据 程 
序 的 需求 变 得 日 益 迫 切 。 但 是 ， 在 数据 输入 量 很 大 时 ， 程 序 的 低 效 率 现象 变 得 非 


常 明显 。 


因此 ， 这 又 要 求 对 效率 问题 给 予 更 大 的 关注 。 例 如 ,一 些 特定 问题 通过 精心 的 设计 可 以 把 


对 大 量 数 据 处 理 的 时 间 限 制 
实现 运行 时 间 的 一 些微 小 缉 





件 


聘 人 员 对 数据 结构 与 算法 的 熟练 程度 ,并 以 此 作为 衡量 应 聘 者 水 


活 运用 ， 甚 至 有 所 发 展 。 正 如 学 
成 果 都 不 了 解 来 龙 去 脉 ， 何 谈 再 有 新 的 


:发 工程 师 必 备 的 基础 知识 之 一 。 社 会 上 大 多 数 公 司 在 招聘 软件 开发 人 员 时 都 
的 重要 依据 。 
本 书 旨 在 使 读者 了 解数 据 结构 与 算法 这 门 课程 ， 掌 握 其 所 含 内 容 的 内 在 规律 
号 字 先 描 红 ， 不 先 模仿 怎么 创新 呢 ?” 如 果 对 现 有 
破 呢 ?哲学 止 讲 ， 只 有 遵从 人 类 的 认 知 

















二 


从 十 几 年 减 至 不 到 一 秒 。 因此 ， 在 某 些 情 况 下 ， 对 于 影响 算法 
节 都 需要 进行 认真 的 探究 。 如 今 ， 数 据 结构 与 算法 已 经 成 为 软 


会 考查 应 


， 最 终 灵 
的 结论 和 
规律 ， 人 


们 才能 更 容易 地 认识 新 事物 7” 教科书 为 了 达到 其 传授 知识 的 目的 ,必须 遵从 人 的 认 知 规律 。 
从 数据 结构 的 发 展 来 看 ， 它 是 应 问题 的 需要 而 出 现 的 ， 并 为 解决 问题 而 服务 。 换 


对 于 数据 结构 的 讲解 ， 应 当 把 








点 放 在 算法 土 ， 在 各 种 典型 问题 上 提出 新 的 数据 





而 言 之 ， 
结构 ; 最 


终 得 出 的 认识 是 ， 为 了 特定 的 问题 和 算法 而 选用 特定 的 数据 结构 ， 为 了 改进 算法 而 改进 数 


据 结 构 ， 为 了 新 的 问题 和 算法 而 创造 出 新 的 数据 结构 。 


本 书 系统 介绍 了 数据 结构 的 基础 理论 知识 及 算法 设计 方法 ， 在 内 容 选 取 上 符 





合计 算 机 


学 科 和 信息 类 学 科 人 才 培 养 目标 的 要 求 及 教学 规律 和 认 知 规律 ， 在 组 织 编排 上 体现 了 “ 先 
理论 、 后 应 用 、 理 论 与 应 用 相 结合 ”的 原则 ， 并 兼顾 学 科 的 广度 和 深度 ， 力 求 适 
全 书 共 分 为 9 章 : 第 1 章 介绍 数据 结构 的 讨论 范畴 、 基 本 概念 、 数 据 的 逻辑 结构 
物理 结构 及 算法 的 描述 与 分 析 ; 第 2 章 介 绍 一 些 重要 的 C 语言 概念 , 同时 对 C 语 
题 进行 了 分 析 ; 第 3 章 介 绍 线性 表 的 各 种 存储 结构 及 相关 应 用 ; 第 4 章 介绍 栈 与 
本 概念 、 各 种 存储 结构 及 相关 应 用 ; 第 5 章 介 绍 串 、 多 维 数组 和 特殊 矩阵 的 存储 

















关 应 用 ; 第 6 章 介绍 树 、 二 又 树 和 森林 的 基本 概念 、 各 种 存储 结构 及 遍历 、 线 索 
二 叉 排序 树 及 相关 应 用 ; 第 7 章 介 绍 图 的 概念 、 各 种 存储 结构 及 遍历 、 最 小 生成 
路 径 、 拓 扑 排序 、 最 短路 径 及 相关 应 用 ; 第 8 章 介绍 5 种 基本 的 排序 算法 (插入 排序 、 交 换 
排序 、 选 择 排序 、 归 并 排序 和 基数 排序 ) 及 相关 应 用 ; 第 9 章 介绍 查找 的 基本 概念 、 静 态 查 
找 表 及 动态 查找 表 的 实现 算法 及 相关 应 用 。 为 了 使 读者 对 相关 知识 有 一 个 更 清晰 
我 们 给 出 了 各 章 之 间 依 赖 关 系 的 结构 图 ， 如 下 图 所 示 。 





















































面 广 。 
、 数 据 的 
言 常见 问 
队列 的 基 
结构 及 相 
二 叉 树 、 
树 、 关 键 





的 脉络 ， 
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本 书 每 一 总 痢 精心 设计 了 经 典 的 应 用 实 由 问题 并 且 附 有 一 定数 量 、 难 度 适 宜 的 课 后 

习题 与 思考 ， 旨 在 引导 读者 不 断 深入 地 学 习 ， 学 以 致 用 ， 灵 活 处 理 一 些 实际 问题 ， 提 高 程 
序 设计 的 能 力 。 本 书 中 的 所 有 算法 , 均 奉 Visual C++ 下 调试 通过 ， 不 需 任 何 修改 就 可 直接 
上 机 运行 、 验 证 。 可 与 本 书 配套 使 用 的 《数据 结 寺 构 重点 难点 问题 剖析 》(C 语言 版 )， 已 由 
浙江 大 学 出 版 社 出 版 ， 书 中 提供 配套 的 习题 和 实习 题 , -并 可 作为 学 习 指导 手册 。 
本 书 由 李 文 书 担任 主编 ， 胡 杰 、 交流 云 、 基 建 主 如 、 王 哲 、 高 海 、 尤 故 名 和 张 琛 
担任 副 主 编 ， 在 写作 过 程 中 编者 参考 了 国内 外 数据 结构 的 最 新 教材 和 研究 成 果 ， 得 到 了 许 
多 老 教授 的 帮助 和 支持 ， 在 此 对 资料 原作 者 和 老 教授 们 表示 记 心 的 感谢 ! 

由 于 编者 水 平 有 限 ， 书 中 难免 存在 不 妥 之 处 ， 敬 请 读者 指正 。 欢 迎 读者 与 编者 联系 ， 


E-mail: wshlee@163.com。 
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初 识 数据 结 


es 


学 司 目标 
(1) 掌握 数据 结构 的 基本 概念 。 


(2) 掌握 抽象 数据 类 型 相关 概念 和 软件 构造 方法 。 
(3) 掌握 算法 的 含义 及 算法 时 间 复 杂 度 的 计算 方法 。 











数据 绍 构 讨论 条 哮 
7 
数据 对 象 
数据 类 型 
线性 结构 
数据 的 逻辑 结构 er 
到 据 的 物理 结构 二 
链 式 存储 结构 
算法 的 描述 与 分 析 





本 章 讨论 的 都 是 一 些 基本 概念 ， 因 此 没有 难点 ， 重 点 在 于 了 解 有 关 数 据 结构 的 各 个 名 
词 和 术语 的 含义 ， 以 及 语句 频 度 计算 和 时 间 复 杂 度 、 空 间 复杂 度 的 估算 方法 。 


(1) 掌握 各 名 词 、 术 语 的 含义 ， 以 及 数据 的 逻辑 结构 和 物理 结构 之 间 的 关系 。 
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(2) 了 解 抽象 数据 类 型 的 定义 、 表 示 和 实现 方法 。 
(3) 理解 算法 5 个 要 素 的 确切 含义 。 
(4) 掌握 计算 语句 频 度 和 估算 算法 时 间 复 杂 度 的 方法 。 


1.1 数据 结构 讨论 范畴 














人 们 利用 计算 机 的 目的 是 解决 实际 的 应 用 问题 。 在 明确 所 要 解决 问题 的 基础 上 ， 经 过 

对 问题 的 深入 分 析 和 抽象 ， 为 其 建立 一 个 逻辑 模型 并 分 析 基 本 的 运算 ， 然 后 确定 恰当 的 数 
据 结构 表示 该 模型 ， 在 此 基础 上 设计 合适 的 数据 存储 和 相关 算法 ， 最 后 完成 具体 的 程序 来 
模拟 和 解决 实际 问题 。 计 算 机 求解 问题 的 核心 是 算法 设计 ， 而 算法 设计 又 高 度 依赖 于 数据 
结构 ， 数 据 结构 的 选择 则 取决 于 问题 本 身 的 需求 。 
在 现实 生活 中 ， 我 们 更 多 的 不 是 解决 数值 计算 的 问题 ， 而 是 借助 一 些 更 科学 、 有 效 的 
手段 (如 表 、 树 和 图 等 数据 结构 )， 更 好 地 处 理 问题 。 例 如 关 在 Web 信息 处 理 方面 ， 我 们 需 
要 图 、 字 符 、 散 列表 、 排 序 、 索 引 、 检 索 等 知识 ;在 人 工 智能 方面 ， 我 们 需要 广义 表 、 集 
合 、 有 向 图 、 搜 索 树 等 知识 ; 在 数据 库 方面 ， 我 们 需要 线性 表 、 链 表 、 排 序 、B+ 索 引 树 等 
知识 ; 在 操作 系统 方面 ， 我 们 需要 队列 、 存 储 管理 表 、 排 序 、 目 录 树 等 知识 ; 在 编译 原理 
方面 ， 我 们 需要 字符 串 、 栈 、 散 列表 、 语 法 树 等 知识 ;在 图 形 图 像 方面 ， 我 们 需要 队列 、 
栈 、 图 、 和 矩阵 、 空 间 索引 、 检 索 等 知识 "总 体 来 说 ， 数 据 结构 是 一 门 研究 非 数值 计算 的 程 
序 设 计 问 题 中 操作 对 象 ， 以 及 它们 之 间 关 系 和 操作 等 相关 问题 的 学 科 。 

20 世纪 70 年 代 初 ， 出 现 了 大 型 程序 ， 软 件 也 开始 相对 独立 ， 结 构 程序 设计 成 为 程序 
设计 方法 学 的 主要 内 容 妆 大 们 越 来 越 重 视 “数据 结构 ,认为 程序 设计 的 实质 是 对 确定 的 问 
题 选择 一 种 好 的 结构 ， 设 计 一 种 好 的 算法 。 可 见 、 数据 结构 在 程序 设计 当中 占据 了 重要 的 
地 位 。 程 序 与 数据 结构 、 算 法 的 关系 如 下 : 

程序 = 数据 结构 + 算法 


























1.2 基本 概念 

















数据 (data) 是 利用 文字 符号 、 数 字符 号 及 其 他 规定 的 符号 对 现实 世界 的 事物 及 其 活动 所 
做 的 抽象 描述 。 它 是 信息 的 载体 ， 能 被 计算 机 识别 、 存 储 和 加 工 处 理 。 随 着 计算 机 技术 的 
发 展 ， 数 据 这 一 概念 的 含义 越 来 越 广泛 。 不仅 整数 、 实 数 、 复 数 等 是 数据 ， 字 符 、 表 格 、 
Wg 声音 、 图 形 、 图 像 等 也 都 能 够 由 计算 机 接收 和 处 理 ， 也 都 是 数据 。 
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表示 一 个 事物 的 一 组 数据 称 为 一 个 数据 元 素 (data element)， 它 是 数据 的 基 
本 单位 ， 在 程序 中 作为 一 个 整体 加 以 考虑 和 处 理 。 在 数据 结构 中 ， 根 据 不 同 的 
【参考 图 文 】 需求 ， 数 据 元 素 又 被 称 为 元 素 、 顶 点 或 记录 。 
数据 项 (data item) 是 具有 独立 含义 的 最 小 标识 单位 。 在 有 些 场合 下 , 数据 项 又 称 为 字段 
或 域 。 例 如 ， 将 一 个 学 生 的 自然 情况 信息 作为 一 个 数据 元 素 ， 而 学 生 信息 中 的 每 一 项 (如 学 
号 、 姓 名 、 出 生年 月 等 ) 为 一 个 数据 项 。 
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数据 对 象 (data object) 是 性 质 相同 的 数据 元 素 的 集合 ， 是 数据 的 一 个 子 集 。 既 然 数 据 对 
象 是 数据 的 子 集 ， 在 实际 应 用 中 ， 处 理 的 数据 元 素 通常 具有 相同 性 质 ， 在 不 产生 混淆 的 情 
况 下 ， 我 们 都 将 数据 对 象 简称 为 数据 。 

数据 类 型 (data type) 是 和 数据 结构 密切 相关 的 一 个 概念 ， 它 最 早出 现在 高 级 程序 语言 
中 ， 用 以 描述 (程序 ) 操 作对 象 的 特性 专属 。 在 用 高 级 程序 语言 编写 的 程序 中 ， 每 个 变量 、 
常量 或 表达 式 都 有 一 个 它 所 属 的 确定 的 数据 类 型 。 数 据 类 型 明显 或 隐 含 地 规定 了 在 程序 执 
行 期 间 变量 或 表达 式 所 有 可 能 取 值 的 范围 ， 以 及 在 这 些 值 上 允许 进行 的 操作 。 因 此 ， 数 据 
类 型 是 一 个 值 的 集合 和 定义 在 这 个 值 集 上 的 一 组 操作 的 总 称 。 例 如 ，C 语言 中 的 整 型 变量 ， 
其 值 集 为 某 个 区 间 上 的 整数 (区 间 大 小 依赖 于 不 同 的 机 器 )， 定 义 在 其 上 的 操作 为 加 、 减 、 
乘 、 除 和 取 模 等 算术 运算 。 

在 C 语 言 中 ， 按 照 取 值 的 不 同 ， 数 据 类 型 可 以 分 为 以 下 两 类 : 

(1) 原子 类 型 :不 可 以 再 分 解 的 基本 类 型 ， 包 括 整 型 、 实 型 ”字符 型 等 。 

(2) 结构 类 型 ， 由 若干 个 类 型 组 合 而 成 ， 是 可 以 再 分 解 的 s 例如 ， 整 型 数组 是 由 若干 
整 型 数据 组 成 的 。 

抽象 数据 类 型 (abstract data type) 是 指 一 个 数学 模型 及 该 模型 上 定义 的 一 组 操作 的 集 
合 。 抽 象 数据 类 型 的 定义 仅 取决 于 它 的 一 组 逻辑 特性 ”而 与 其 在 计算 机 内 部 如 何 表示 和 实 
现 无 关 ， 即 不 论 其 内 部 结构 如 何 变化 ， 只 要 它 的 数学 特性 不 变 ， 都 不 影响 其 外 部 的 使 用 。 

于 ， 抽 象 数据 类 型 体现 了 程序 设计 中 问题 分 解 、 抽 象 和 信息 隐藏 的 特性 。 抽 象 数据 类 
型 把 实际 生活 中 的 问题 分 解 为 多 个 规模 小 且 容 易 处 理 的 问题 ,- 然 后 建立 一 个 计算 机 能 处 理 的 数 
据 类 型 ， 并 把 每 个 功能 模块 的 实现 细节 作为 一 个 独立 的 单元 < 从 而 使 其 具体 实现 过 程 隐藏 起 来 。 

为 了 使 于 在 之 后 的 讲解 中 对 抽象 数据 类 型 进行 规范 的 描述 ， 我 们 给 出 了 描述 抽象 数据 
类 型 的 标准 格式 : 

ADT 抽象 数据 类 型 名 

Data 

数据 元 素 之 间 迪 辑 关 系 的 定义 
Operation 

二 











































































初始 条 件 
结果 描述 


endADT 


数据 结构 (data structure) 是 指 相互 之 间 存 在 一 种 或 多 种 特定 关系 的 数据 元 素 集合 ， 加 各 党 加 
其 主要 研究 数据 的 逻辑 结构 、 物 理 结构 及 数据 的 运算 。 在 计算 机 中 ， 数据 元 素 并 不 是 SR 
孤立 、 杂 乱 无 章 的 ， 而 是 具有 内 在 联系 的 数据 集合 。 数 据 元 素 之 间 存 在 的 一 种 或 多 种 ” 固 
特定 关系 ， 也 就 是 数据 的 组 织 形式 。 为 编写 出 一 个 “好 ”的 程序 ， 必 须 分 析 待 处 理 对 【参考 图 文 】 
象 的 特性 及 各 处 理 对 象 之 间 存 在 的 关系 。 这 也 是 研究 数据 结构 的 意义 所 在 。 

一 般 来 说 ， 我 们 把 数据 结构 分 为 逻辑 结构 和 物理 结构 。 
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1.3 ”数据 的 逻辑 结构 


逻辑 结构 是 指数 据 对 象 中 数据 元 素 之 间 的 相互 关系 。 风 辑 结 构 是 我 们 今后 学 习 数 据 
结构 最 需 关 注 的 内 容 。 逻 辑 结构 可 分 为 以 下 4 种 : 集合 结构 、 线 性 结构 、 树 形 结构 和 图 

















1， 集 合 结构 

集合 结构 中 的 数据 元 素 除 了 同属 于 一 个 集合 外 ， 它 们 之 问 没 有 其 他 关系 。 各 个 数据 元 
素 是 “平等 ”的 ， 它 们 的 共同 属性 是 “同属 于 一 个 集合 ”。 数 据 结构 中 的 集合 关系 就 类 似 于 
数学 中 的 集合 ， 如 图 1.1 所 示 。 





2， 线 性 结构 人 ~ 
线性 结构 中 的 数据 元 素 之 间 是 一 对 一 的 关系 ， 如 图 1.2 所 示 。 


1.2 ”线性 结构 示意 图 


3， 树 形 结构 
树 形 结构 中 的 数据 元 素 之 间 存 在 一 对 多 的 层次 关系 ， 如 图 1.3 所 示 。 
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图 1.3 树 形 结构 示意 图 





4， 图 状 结构 
图 状 结构 的 数据 元 素 是 多 对 多 的 关系 ， 如 图 1.4 所 示 。 





“图 14 图 枯 结 构 示 意图 
< 一 — 

在 上 述 图 例 中 ,我们 将 每 一 个 数据 元 素 看 作 一 个 结 点 ， 用 圆 图 表示。 元 素 之 间 的 远 
辑 关系 用 结 点 之 间 的 连 线 表 示 。 如 果 这 个 关系 是 有 方向 的 ， 那 么 用 带 箭头 的 连 线 表示 





到 辑 结构 是 针对 具体 问题 的 ， 是 为 了 解决 菜 个 问题 ， 在 对 问题 理解 的 基础 上 ， 选 择 一 个 
合适 的 数据 结构 表示 数据 元 素 之 间 的 关系 。 


1.4 数据 的 物理 结构 


数据 结构 在 计算 机 中 的 表示 (又 称 为 映像 ) 称 为 数据 的 物理 结构 ， 也 称 为 存储 结构 ， 是 
指数 据 的 逻辑 结构 在 计算 机 中 的 存储 形式 。 数 据 的 存储 结构 应 正确 反映 数据 元 素 之 间 的 逻 
辑 关系 。 如 何 存 储 数 据 元 素 之 间 的 逻辑 关系 ， 是 实现 物理 结构 的 重点 和 难点 。 

元 素 之 间 的 关系 在 计算 机 中 有 两 种 不 同 的 表示 方法 : 顺序 映像 和 非 顺序 映像 ， 并 由 此 
得 到 数据 元 素 两 种 不 同 的 存储 结构 ， 即 顺序 存储 和 链 式 存储 。 

1， 顺序 存储 结构 

把 数据 元 素 存放 在 地 址 连续 的 存储 单元 里 ， 其 数据 间 的 逻辑 关系 和 物理 关系 是 一 致 
的 ， 借 助 元 素 在 存储 器 中 的 相对 位 置 来 表示 数据 元 素 之 间 的 逻辑 关系 ， 如 图 1.5 所 示 。 

2. 链 式 存储 结构 


把 数据 元 素 存放 在 任意 的 存储 单元 里 ， 这 组 存储 单元 可 以 是 连续 的 ， 也 可 以 是 不 连续 
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的 。 数 据 元 素 的 存储 关系 并 不 能 反映 其 逻辑 关系 ， 因 此 需要 借助 指示 元 素 存储 地 址 的 指针 
(pointer) 表 示 数 据 元 素 之 间 的 逻辑 关系 ， 如 图 1.6 所 示 。 
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1.5 ”顺序 存储 结构 示意 图 
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图 1.6 链 式 存储 结 构 示 意图 


数据 的 逻辑 结构 和 物理 结构 是 密切 相关 的 两 个 方面 ， 同 一 逻辑 结构 可 以 对 应 不 同 的 物 
理 结 构 。 以 后 读者 会 看 到 ， 任 何 一 个 算法 的 设计 取决 于 选 定 的 数据 (逻辑 ) 结 构 ， 而 算法 的 
实现 依赖 于 采用 的 存储 结构 。 逻 辑 结构 是 面向 问题 的 ， 而 物理 结构 是 面向 计算 机 的 ， 其 基 
本 的 目标 是 将 数据 及 其 逻辑 关系 存储 到 计算 机 的 内 存 中 3 


1.5 ”算法 的 描述 与 分 析 














1.5.1 算法 的 描述 


回 妨 芝 回 算法 是 描述 求解 问题 方法 的 操作 步骤 的 集合 。 它 主要 有 4 种 形式 : 框图 形式 、 
多 ”文字 形式 、 伪 码 形式 和 程序 设计 语言 形式 。 

[DA 框图 形式 简单 、 直 观 、 易 懂 ， 但 在 描述 比较 复杂 的 算法 时 ， 显 得 不 够 方便 ， 

【参考 图 文 】 甚至 难于 把 算法 清晰 、 简 洁 地 描述 出 来 ; 文字 形式 同样 简单 、 易 懂 ， 但 在 描述 复 
杂 算 法 时 ， 显 得 不 够 简洁 、 清 晰 ; 伪 代 码 形式 与 高 级 程序 设计 仿 ， 包 括 了 高 级 语言 
的 基本 语言 成 分 ， 并 且 较 为 简单 ， 虽 不 能 在 计算 机 上 直接 运行 ， 但 容易 编写 和 阅读 ， 需 要 
时 改写 为 对 应 的 高 级 语言 程序 也 很 容易 ;程序 设计 语言 形式 必须 严格 按照 所 使 用 的 高 级 语 
言 的 语法 规则 来 描述 算法 ， 可 直接 在 计算 机 上 运行 获得 结果 。 





算法 有 以 下 5 个 要 素 : 
(1) 有 穷 性 。 有 穷 性 是 指 一 个 算法 必须 总 是 在 执行 有 穷 步 之 后 结束 ， 且 每 一 步 都 可 在 
有 穷 时 间 内 完成 。 





(2) 确定 性 。 确 定性 是 指 算法 中 每 一 条 指令 必须 有 确切 的 含义 ， 读 者 理解 时 不 会 产生 
二 义 性 。 并 且 ， 在 任何 条 件 下 ， 算 法 只 有 唯一 的 一 条 执行 路 径 ， 即 对 于 相同 的 输入 只 能 得 
出 相同 的 输出 。 
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(3) 可 行 性 。 可 行 性 是 指 一 个 算法 是 能 行 的 ， 即 算法 中 描述 的 操作 都 是 可 以 通过 已 经 
实现 的 基本 运算 执行 有 限 次 来 实现 的 。 

(4) 输入 。 输 入 是 指 一 个 算法 有 和 零 个 或 多 个 的 输入 ， 这 些 输入 取 自 于 某 个 特定 的 对 象 
的 集合 。 

(5) 输出 。 输 出 是 指 一 个 算法 有 一 个 或 多 个 的 输出 ， 这 些 输 出 是 同 输入 有 着 某 些 特定 
关系 的 量 。 


1.5.2 ”算法 的 分 析 


评价 一 个 算法 一 般 从 正确 性 、 可 读 性 、 健 壮 性 、 时 间 复 杂 度 与 空间 复杂 度 五 个 主要 方 
进行 。 对 于 实际 问题 ， 我 们 主要 分 析 其 时 间 复 杂 度 和 空间 复杂 度 。 
一 般 从 算法 中 选取 一 种 基本 操作 ， 以 其 重复 执行 次 数 作为 时 间 复 杂 度 的 依据 ， 它 取决 
F 问 题 的 规模 n 和 待 处 理 数据 的 初 态 。 
算法 需要 占用 的 存储 空间 分 为 3 部 分 ， 输 入 数据 所 占用 的 空间 、 程序 代码 所 占用 的 空 
间 和 辅助 变量 所 占用 的 空间 。 一般, 输入 数据 所 占用 的 衬 间 与 算法 无 关 ， 取决 于 问题 本 身 
程序 代码 所 占用 的 空间 对 不 同 算法 不 会 有 数量 级 的 差别 。 因 此 ， 空 间 复 杂 度 主要 考虑 算法 
执行 过 程 中 辅助 变量 所 占用 的 空间 ， 一 般 以 最 坏 情况 下 的 空间 复杂 度 作为 算法 的 空间 复杂 度 。 
一 般 程 序 运行 的 时 间 与 下 列 因 素 有 关 汪 | 
(1) 程序 的 输入 。 SA 
(2) 编译 的 目标 代码 的 质量 。 
(3) 执行 程序 机 器 指令 的 性 质 和 速度 。 > 
(4) 构成 程序 的 算法 的 时 间 复 杂 度 。 
正 因为 有 如 此 多 的 因素 ,- 为 了 能 比较 客观 地 评价 和 比较 算法 ， 有 必要 分 析 一 下 各 种 因 
素 对 算法 时 间 的 影响 及 如 何 正确 处 理 这 些 因素 、、 
运行 时 间 是 输入 规模 的 函数 fm)， 但 是 要 记 住 fn) 不 等 同 于 要 求 的 时 间 复 杂 度 Tan)。 
由 于 在 实际 情况 中 ， 程 序 的 输入 不 是 一 个 确定 的 值 a, 而 是 一 个 不 确定 的 输入 量 。n 值 表示 
输入 数据 的 规模 。 这 就 涉及 两 个 重要 的 概念 : 最 坏 时 间 复 杂 度 和 平均 时 间 复 杂 度 。 
最 坏 时 间 复 杂 度 : 规模 为 n 的 所 有 输入 量程 序 运行 时 间 的 最 大 值 。 
平均 时 间 复 杂 度 ， 规 模 为 n 的 所 有 输入 量程 序 运行 时 间 的 平均 值 。 
于 平均 时 间 复杂 度 比 最 坏 时 间 复 杂 度 要 复杂 ， 所 以 常常 通过 求 最 坏 时 间 复 杂 度 来 表 
示 某 个 算法 的 时 间 复 杂 度 。 但 是 必须 要 记 住 这 两 者 是 有 区 别 的 ， 也 就 是 说 ， 最 坏 时 间 复 杂 
度 最 小 的 算法 不 一 定 是 平均 时 间 复 杂 度 最 小 的 算法 。 
于 算法 的 执行 时 间 和 运行 程序 的 计算 机 有 着 密切 的 联系 ， 所 以 T(n) 不 能 直接 表达 成 
n 的 函数 ， 而 要 用 “ 阶 ”来 表示 。 
定义 1 O(g(n))={fln) | 车 存在 正常 数 C 和 no, 使 得 对 所 有 的 n 三 no, 有 |f(n)| 志 Clg(n)|}。 
定义 2。”Q(g(n))={ftn) | 车 存在 正常 数 C 和 no, 使 得 对 所 有 的 n 宇 no, 有 |f(n)| 宇 Clg(n)| }。 
定义 3 eB(g(n))={f(n) | 若 存 在 正常 数 Cl、C 和 no, 使 得 对 所 有 的 nno, 有 Clg(n)| 夸 
fn) czlgo 
由 于 存在 重要 结论 Ti(n)+T2(n) =O(max(f(n)，g(n)))， 所 以 一 个 程序 的 时 间 复 杂 度 由 程 
分 组 成 ， 这 一 点 是 非常 有 用 的 。 
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另外 ， 当 算法 的 时 间 复 杂 度 T (n) 与 数据 个 数 n 无 关系 时 ，T (n) 和 c* 1， 所 以 此 时 算 
法 的 时 间 复 杂 度 T(nD)=O (1); 当 算 法 的 时 间 复 杂 度 T (no) 与 数据 个 数 n 为 线性 关系 时 ， 算 法 
的 时 间 复 杂 度 TOn) = O (n); 以 此 类 推 分 析 一 个 算法 中 基本 语句 执行 次 数 与 数据 个 数 的 函数 
关系 ， 就 可 求 出 该 算法 的 时 间 复 杂 度 。 

在 C 语言 表示 的 算法 中 ， 算 法 的 时 间 复 杂 度 一 般 与 程序 执行 的 步骤 数 有 关系 ， 一 
所 有 步 又 的 时 间 复 杂 度 总 和 ， 所 以 需要 对 一 些 语句 的 运行 时 间 做 出 估计 。 例 如 : 

(1) 算数 运算 时 间 为 0(1)。 

(2) 逻辑 预算 时 间 为 0(1)。 

(3) 赋值 运算 时 间 为 0(1)。 

(4) 让 语句 的 运行 时 间 为 测试 语句 运行 时 间 与 后 续 执行 语句 运行 时 间 的 和 。 

(5) while 语句 的 运行 时 间 为 每 次 执行 循环 体 的 时 间 与 循环 次 数 之 积 。 

(6) for 语句 的 运行 实际 与 while 相似 。 

(7) return 语句 的 运行 时 间 为 0(1)。 

我 们 希望 随 着 问题 规模 n 的 增 大 其 时 间 复 杂 度 趋 于 稳定 过 上 升 ， 但 上 升幅 度 不 能 太 大 。 
常见 T(n) 随 n 变化 的 增长 率 如 图 1.7 所 示 。 


失 多 注意 

1) 一 般 常用 的 时 间 复 杂 度 的 关系 

OU) < O(logzn) < O(n) < Onlog2n) < O(n’) = O(n A < Oo < O0(2") 
其 中 ，2 项 和 4 项 中 的 2 是 对 数 的 底 ，k 二 3。 

2) 使 用 logn 或 者 lgn， 没有 指明 底数 

原因 在 于 ， 对 于 对 数 ， 公式 logxy=(logmy)/(16gmx) 成 立 。 其 中 ，x 和 m 是 对 数 的 底 ， 而 m 
是 任何 大 于 0 且 不 等 于 1 的 数 。 当 底数 为 - 10 时， 在 数学 上 ， 习 惯 简 写成 lg。 从 而 有 
O(logan)=O((logn)/(logam))=O((logsn)/(logsm))=", 显然 logam、logsm 是 一 个 常量 ， 可 以 从 括 
号 中 提出 来 ， 于 是 有 O(lognm)= O(logxn)= O(logsn)=…。 我 们 看 到 ， 底 数 不 管 为 2 还 是 3 还 是 
其 他 任何 大 于 0 且 不 等 于 1 的 数 , 它们 的 上 界 都 一 样 。 于 是 为 了 统一 和 简便 ， 都 写成 O(logn)。 
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图 1.7 常见 的 Tn) 随 n 变化 的 增长 率 
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接 下 来 通过 分 析 一 些 算法 的 实例 来 了 解 如 何 运用 这 些 理论 。 
例 1.1 设 数组 a 和 b 在 前 边 部 分 已 赋值 ， 求 两 个 n 阶 和 矩阵 相 乘 运算 算法 的 时 间 复杂 度 。 


for (int i=0;i<n;i++) 

{ 
for (int j=0;j<n;j++) 
{ 





c[il [j]=0; // 基 本 语 旬 1 
for (int k=0;k<n;k++) 
cS[i] [ji]=c[i] (j]+a[li] [kKk]*b[k] (j]; // 基 本 语句 2 


} 


解 : 设 基本 语句 的 执行 次 数 为 f(n), 有 fn) = cinz + cm 。 因 To)= Won) = cim2+ cn3= cn’, 
其 中 c1、c2、c 可 为 任意 常数 ， 所 以 该 算法 的 时 间 复 杂 度 为 On)。 

例 1.2 求 下 面 程序 段 的 时 间 复 杂 度 。 

nt da Ly 

while (i <= n) 

{ YA， 

= XA NN 

} ANFP 

解 ， 设 第 一 次 循环 k=1， 此 时 :i=1*3， 第 二 次 循环 2 此 时 =1*3*3=32， 以 此 类 推 ， 
第 工 次 循环 k=T， 此 时 i=375 又 1 和 n， 即 3 入 ny 对 此 方程 两 边 取 对 数 ， 则 T 入 logan( 关 
键 是 求 while 循环 的 次 数 )。 从 而 该 程序 的 时 间 复 杂 度 为 O(logan)。 


本 章 小 结 


本 章 是 为 以 后 各 章 讨论 的 内 容 作 基本 知识 的 准备 ， 介 绍 了 数据 结构 和 算法 等 基本 概 
念 。 数 据 结构 是 由 若干 特性 相同 的 数据 元 素 构成 的 集合 ， 并 且 在 集合 上 存在 一 种 或 多 种 关 
系 。 根 据 关 系 的 不 同 ， 可 将 数据 结构 分 为 4 类 : 集合 结构 、 线 性 结构 、 树 形 结构 和 图 状 结 
构 。 数 据 的 存储 结构 是 数据 逻辑 结构 在 计算 机 中 的 映像 。 由 于 数据 是 计算 机 操作 对 象 的 总 
称 ， 它 是 计算 机 处 理 的 符号 的 集合 ， 集 合 中 的 个 体 为 一 个 数据 元 素 。 数 据 元 素 可 以 是 不 可 
分 割 的 原子 ， 也 可 以 由 若干 数据 项 组 成 ， 因 此 在 数据 结构 中 讨论 的 基本 单位 是 数据 元 
素 ， 而 最 小 单位 是 数据 项 。 
我 们 可 以 用 图 1.8 来 说 明 数 据 对 象 、 数 据 元 素 和 数据 项 之 间 的 关系 。 

由 两 种 映像 方法 我 们 可 以 得 到 两 类 存储 结构 : 一 类 是 顺序 存储 结构 ， 它 以 数据 元 素 相 
对 的 存储 位 置 表示 关系 ， 则 存储 结构 中 只 包含 数据 元 素 本 身 的 信息 ， 男 一 类 是 链 式 存储 结 
构 ， 它 以 附加 的 指针 信息 (后 继 元 素 的 存储 地 址 ) 表 示 关系 。 

数据 结构 的 操作 是 和 数据 结构 本 身 密 不 可 分 的 ， 两 者 作为 一 个 整体 可 用 抽象 数据 类 型 
进行 描述 。 抽 象 数据 类 型 是 一 个 数学 模型 以 及 定义 在 该 模型 上 的 一 组 操作 ， 因 此 它 和 高 级 
程序 设计 语言 中 的 数据 类 型 具有 相同 含义 ， 而 抽象 数据 类 型 的 范畴 更 广 ， 它 不 局 限于 现 有 
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程序 设计 语言 中 已 经 实现 的 数据 类 型 (它们 通常 被 称 为 固有 数据 类 型 )， 但 抽象 数据 类 型 需 


要 借用 回 有 数据 类 型 表示 并 实现 。 抽 象 数据 类 型 的 三 大 要 素 为 数据 对 象 、 数 据 关系 和 基本 
操作 ， 同 时 数据 抽象 和 数据 封装 是 抽象 数据 类 型 的 两 个 重要 特性 。 


























图 1.8 数据 结构 关系 示意 图 


算法 是 进行 程序 设计 的 另 一 不 可 缺少 的 要 素 。 算法 是 对 问题 求解 的 一 种 描述 ， 是 为 解 
次 一 个 或 一 类 问题 给 出 的 一 种 确定 规则 的 描述 。 一 个 完整 的 算法 应 该 具有 下 列 5 个 要 素 : 
有 穷 性 、 确 定性 、 可 行 性 、 输 入 和 输出。 一 个 正确 的 算法 为 对 苛刻 且 带 有 刁难 性 的 输入 数 
据 也 能 得 出 正确 的 结果 ， 并 且 对 不 正确 的 输入 也 能 做 出 正确 的 反映 。 
算法 的 时 间 复 杂 度 是 比较 不 同 算法 效率 的 一 种 准则 ， 算 法 时 间 复 杂 度 的 估算 基于 
算法 中 基本 操作 的 重复 执行 次 数 ， 或 处 于 最 深层 循环 内 的 语句 频 度 。 算 法 空间 复杂 度 
可 作为 算法 所 需 存 储量 的 一 种 量度 ， 它 主要 取决 于 算法 的 输入 量 和 辅助 变量 所 占 空 
间 ， 若 算法 的 输入 仅 取决 于 问题 本 奥 而 和 算法 无 关 ， 则 算法 空间 复杂 度 的 估算 只 需 考 
察 算法 中 所 用 辅助 变量 所 占 空间 。 














习题 与 思考 
1.1 单 选 题 - 
1. 算法 的 计算 量 的 大 小 称 为 计算 的 ( 。 )。 
A. 效率 B. 复杂 性 C. 现实 性 D. 难度 
2. 计算 机 算法 指 的 是 (1 )， 它 必须 具备 (2 。”) 这 3 个 特性 。 
(1)A. 计算 方法 B. 排序 方法 
C. 解决 问题 的 步骤 序列 D. 调度 方法 
(2) A. 可 执行 性 、 可 移植 性 、 可 扩充 性 B. 可 执行 性 、 确 定性 、 有 穷 性 
C. 确定 性 、 有 穷 性 、 稳 定性 D. 易 读 性 、 稳 定性 、 安 全 性 


3. 从 逻辑 上 可 以 把 存储 结构 分 为 ( 。”) 两 大 类 。 


A. 动态 结构 、 静 态 结构 B. 顺序 结构 、 链 式 结构 

C. 线性 结构 、 非 线性 结构 D. 初等 结构 、 构 造型 结构 
4. 连续 存储 设计 时 ， 存 储 单元 的 地 址 ( 。”)。 

A. 一 定 连续 B. 一 定 不 连续 

C. 不 一 定 连续 D. 部 分 连续 ， 部 分 不 连续 





5. 在 下 面 的 程序 段 中 ， 对 x 的 赋值 语句 的 频 度 为 ( )。 


an 
6 De 


A. O(2n) B. O(n) C. 0 D. O(log,") 
1.2 填空 
1. 对 于 给 定 的 n 个 元 素 ， 可 以 构成 的 逻辑 结构 有 、 
4 种 。 
2. 数据 的 物理 结构 包括 的 表示 和 ”的 表示 。 
3. 数据 结构 中 评价 算法 的 两 个 重要 指标 是 和 
4. 算法 具有 5 个 特性 : 一 ， 有 和 零 个 或 多 个 输入 ， 有 一 
个 或 多 个 输出 。 
5. 下面 程序 段 的 时 间 复 杂 度 为 
sum=1; ANNA 
for (i=0;sum<n;i++) sum+=17 YY \ 


1.3 ”思考 题 SN 

1， 解 释 下 列 名 词 : 数据 、 数 据 元 素 、 数 据 结 构 、 数 据 类 型 、 抽 象 数据 类 型 、 算 法 、 
时 间 复 杂 度 、 空 间 复杂 度 。 

2， 算 法 分 析 的 目的 是 什么 ? | 

3. 什么 是 算法 的 最 坏 时 间 复杂 度 和 平均 时 间 复 杂 度 ?™ 、 

4. 评价 一 个 好 的 算法 , “是 从 哪儿 个 方面 来 考虑 的 ? 

5， 有 实现 同一 功能 的 两 个 算法 Al 和 As, -其 中 “Ai 的 时 间 复 杂 度 为 Ti=0(2”)，A; 的 
时 间 复杂 度 为 T=O(n?)， 仅 就 时 间 复 杂 度 而 言 请 具体 分 析 这 两 个 算法 哪 一 个 好 。 

6， 试 编写 算法 ， 求 一 元 多 项 式 P(x) 二 >》 aixi 的 值 P,(xo) ， 并 确定 算法 中 的 每 一 语句 

i=0 

的 执行 次 数 和 整个 算法 的 时 间 复 杂 度 ， 规 定 算法 中 不 能 使 用 求 寡 函 数 。 注 意 : 本 题 中 的 输 
入 为 ai(i= 01…,n)，xo 和 n， 输 出 为 P,(xo) 。 在 本 题 算法 中 以 你 认为 较 好 的 一 种 方式 实现 
输入 和 输出 。 

7. 调用 下 列 f(n)， 回 答 下 列 问题 : 

(1) 试 指出 f(n) 值 的 大 小 ， 并 写 出 ftn) 值 的 推导 过 程 ; 

(2) 假定 n= 5， 试 指出 f(5) 值 的 大 小 和 执行 5) 时 的 输出 结果 。 

int f(int n) 

{ 





for(i=1;i<=n;i++) 
for(j=1;j<=n;j++) 
x+=1; 




















(n>1)。 




















int i,j,k,sum= 0; 
for(i=l1;i<n+1;i++) 
{ 
for(j=n;j>i-1;j--) 
for(k=1; k<j+1; k++) 
sumt++; 
printf("sum=%d\n", sum); 
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8 斐 波 那 契 数 列 Fu 的 定义 如 下 : 
巴 =0,E =1F,=F +F ,n=2,3,.… 





回答 下 列 问题 : 
(1) 在 递归 计算 Fn 的 时 候 ， 需 要 对 较 小 的 F-,，Fn->，…，Fl，Fo 精确 计算 多 少 次 ? 
(2) 递归 计算 Fs, 时， 递归 函数 的 时 间 复 杂 度 是 多 少 ? 





重要 的 C 语言 概念 


(1) 熟悉 内 存 分 配 、 结 构 数组 和 结构 指针 的 有 关 概 念 
(2) 理解 动态 内 存 分 配 的 内 涵 和 设计 方法 。 











静态 内 存 分 配 


动态 内 存 分 配 





C 语 言 程序 编译 的 内 存 分 配 





结构 指针 
指针 和 数组 








C 语 言 常见 问题 分 析 
void 及 void 指针 


关于 C 语 言 的 高 效 编程 











其 他 若干 问题 


(1) 动态 内 存 的 分 配方 法 。 
(2) C 语言 编译 的 内 存 分 配 。 


本 章 简要 介绍 算法 描述 和 程序 设计 中 要 用 到 的 一 些 C 语言 程序 设计 的 重要 知识 。 
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2.1 内 存 分 配 


2.1.1 静态 内 存 分 配 


程序 中 定义 变量 或 数组 时 ， 给 其 分 配 的 内 存单 元 大 小 是 在 编写 程序 时 确定 的 ， 并 且 在 
程序 执行 过 程 中 无 法 改变 。 例 如 : 


int a=100; 


此 行 代码 指示 编译 器 分 配 足够 的 存储 区 以 存放 一 个 整 型 值 , 该 存储 区 与 名 字 a 相关 联 ， 
并 用 数值 100 初始 化 该 存储 区 。 


2.1.2 动态 内 存 分 配 


设计 人 员 可 以 根据 具体 问题 的 具体 需要 ， 在 程序 运行 时 再 具体 确定 数组 的 个 数 或 占用 
内 存单 元 的 大 小 ， 从 而 在 程序 运行 时 具体 确定 所 需要 的 内 存单 元 空间 。 以 下 是 采用 动态 分 
配方 式 的 例子 : - 


char *pl=(char *)malloc(10*sizeof(iht) ‘ 


此 行 代码 分 配 了 10 个 int 类 型 的 对 象 ， 然 后 返回 对 象 在 内 存 中 的 地 址 ， 接 着 这 个 地 址 
被 用 来 初始 化 指针 对 象 p1。 对 动态 分 配 的 内 存 的 唯一 访问 方式 是 通过 指针 间接 地 访问 ， 其 
释放 方法 为 free(p1)， 用 于 释放 动态 分 配 的 内 存 空间 13 另外 , 在 C 语言 中 , 还 有 calloc() 
和 realloc( )， 用 于 动态 分 配 空间 。 它 们 之 间 的 区 别 如 下 。 

(1) malloc(n*sizeof(int)): 请 求 n 个 连续 的 s 每 个 长 度 为 整 型 的 空间 ， 若 成 功 则 返回 这 
些 空间 的 首 地 址 ; 若 失败 则 返回 0。 

(2) calloc(nsizeof(int)): 请 求 n 个 连续 的 、 每 个 长 度 为 整 型 的 空间 ， 若 成 功 则 返回 这 
些 空间 的 首 地 址 并 将 每 个 空间 赋值 为 0， 若 失败 则 返回 0。 

(3) realloc(p,sizeoffinb*n): 给 一 个 已 经 分 配 了 地 址 的 指针 重新 分 配 空间 。 参 数 p 为 原 
有 的 空间 地 址 ，sizeoftint)*n 是 重新 申请 的 地 址 长 度 ， 用 于 分 配 不 足 的 时 候 。 

下 面 我 们 设计 一 个 用 动态 数组 保存 字符 串 数据 的 示例 。 

#include<stdio.h> 

#include<malloc.h> 

#include<string.h> 

Void main(void) 

{ 















































| 









































int length=100; 

char *str, sl[]="Data Structure"; 

Tn A Dy 

str=(char *)malloc(sizeof(char))* length); /7 动态 分 配 空间 
strcpy(str, s1); 

n= strlen(str); 

printf("str="); 


is 
© ~ 


for(i=0;i<n;i++) printf("%c", str [i]); 
free(str )7 


2.1.3 C 语言 程序 编译 的 内 存 分 配 


一 个 C 程序 占用 的 内 存 可 分 为 以 下 几 种 常用 方式 。 
1- 渍 


栈 (stack) 是 由 编译 器 自动 分 配 和 释放 的 区 域 ， 主 要 存储 函数 的 参数 、 函 数 的 局 部 变量 
等 。 当 一 个 函数 开始 执行 时 ， 该 函数 所 需 的 实 参 、 局 部 变量 就 进入 栈 中， 该 函数 执行 完毕 
后 ， 之 前 进入 栈 中 的 参数 和 变量 等 也 都 出 栈 被 释放 掉 。 它 的 运行 方式 类 似 于 数据 结构 中 的 
栈 ( 见 第 4 章 )。 函 数 调 用 时 会 在 栈 上 有 一 系列 的 保留 现场 及 传递 参数 的 操作 。 栈 的 空间 大 
小 有 限定 ，VC 默认 是 2MB。 栈 不 够 用 的 情况 一 般 是 程序 中 分 配 了 大量 数组 和 递归 函数 层 
次 太 深 。 有 一 点 必须 知道 ， 当 一 个 函数 调用 完 返 回 后 它 会 释放 该 函数 中 所 有 的 栈 空间 。 

2. 堆 


堆 (heap) 是 由 程序 员 控 制 分 配 和 释放 的 区 域 ， 在 C 语言 中 ， 用 malloc( ) 函 数 分 配 的 空 
间 就 存在 于 堆 上 。 在 堆 上 分 配 的 空间 不 像 栈 一 样 在 某 个 函数 执行 完毕 就 自动 释放 ， 而 是 一 
直 存 在 于 整个 程序 的 运行 期 间 。 当 然 ,、 如 果 不 手 动 释放 [free( ) 函 数 ] 这 些 空间 ， 在 程序 运行 
结束 后 系统 也 会 将 之 自动 释放 。 对 于 小 程序 来 说 ， 可 能 感觉 不 到 影响 ， 但 对 于 大 程序 ， 如 
一 个 大 型 游戏 ， 就 会 遇 到 内 存 不 够 用 的 问题 了 。 

堆 是 动态 分 配 内 存 的 ， 并 且 可 以 分 配 使 用 很 大 的 内 存 。 但 是 用 不 好 会 造成 内 存 泄 沁 。 
并 且 频 繁 地 分 配 [malloc( 信和 释放 [free( )] 内 存 会 放生 内 存 碎 片 (有 点 类 似 磁 稚 碎 片 )， 因 为 C 
语言 分 配 动 态 内 存 时 是 寻找 匹配 的 内 存 的 而 用 栈 则 不 会 产生 碎片 ， 在 栈 上 存 取 数据 比 通 
过 指针 在 堆 上 在 取 数 据 快 些 。 一 般 大 家 所 说 的 堆栈 是 指 栈 (stack)。 栈 是 先入 后 出 的 ， 一 般 
由 高 地 址 向 低地 址 生长 。 
堆 和 栈 是 C/C++ 编程 不 可 避免 会 碰 到 的 两 个 基本 概念 。 首 先 ， 这 两 个 概念 都 可 以 在 讲 
数据 结构 的 书 中 找到 ， 它 们 都 是 基本 的 数据 结构 ， 虽 然 栈 更 为 简单 一 些 。 在 具体 的 C/C++ 
编程 框架 中 ， 这 两 个 概念 并 不 是 并 行 的 。 对 底层 机 器 代码 的 研究 可 以 揭示 ， 栈 是 机 器 系统 
提供 的 数据 结构 ， 而 堆 则 是 C/C++ 函 数 库 提供 的 。 具 体 地 说 ， 现 代 计 算 机 ( 串 行 执行 机 制 ) 
都 直接 在 代码 底层 支持 栈 的 数据 结构 。 这 体现 在 有 专门 的 寄存 器 指向 栈 所 在 的 地 址 ， 有 专 
门 的 机 器 指令 完成 数据 入 栈 、 出 栈 的 操作 。 这 种 机 制 的 特点 是 效率 高 ， 支 持 的 数据 有 限 ， 
一 般 是 整数 、 指 针 、 浮 点 数 等 系统 直接 支持 的 数据 类 型 ， 并 不 直接 支持 其 他 的 数据 结构 。 
因为 栈 的 这 种 特点 ， 栈 的 使 用 在 程序 中 是 非常 频繁 的 。 对 子 程序 的 调用 就 是 直接 利用 栈 完成 
的 。 机 器 的 call 指令 里 隐 含 了 把 返回 地 址 推 入 栈 ， 然 后 跳 转 至 子 程序 地 址 的 操作 ， 而 子 程序 
中 的 ret 指令 则 隐 含 从 堆栈 中 弹出 返回 地 址 并 跳 转 至 返回 地 址 的 操作 。C/C++ 中 的 自动 变量 
是 直接 利用 栈 的 例子 ， 这 也 就 是 为 什么 当 函 数 返回 时 该 函数 的 自动 变量 自动 失效 的 原因 。 
和 栈 不 同 ， 堆 的 数据 结构 并 不 是 由 系统 (无 论 是 机 器 系统 还 是 操作 系统 ) 支 持 的 ， 而 是 
函数 库 提 供 的 。 基 本 的 malloc/realloc/free 函数 维护 了 一 套 内 部 的 堆 数据 结构 。 当 程序 使 
用 这 些 函数 去 获得 新 的 内 存 空 间 时 ， 这 套 函 数 首先 试图 从 内 部 堆 中 寻找 可 用 的 内 存 空间 ， 
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如 果 没 有 可 以 使 用 的 内 存 空间 ， 则 试 
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新 分 配 得 到 的 空间 首先 被 组 织 进 内 部 堆 中 去 ， 然 后 以 适当 的 形式 返 
放 分 配 的 内 存 空间 时 , 这 片 内 存 空间 被 返回 内 部 堆 结 构 中 ,可 能 会 被 适当 地 处 理 ( 如 和 其 他 
空闲 空间 合并 成 更 大 的 空闲 空间 )， 以 更 适合 下 一 次 内 存 分 配 申请 。 这 套 复杂 的 分 配 机 制 实 
际 上 相当 于 一 个 内 存 分 配 的 缓冲 池 (Cache)， 使 用 这 套 机 制 有 如 下 原 

(1) 系统 调用 可 能 不 支持 任意 大 小 的 内 存 分 配 。 


利用 系统 调用 来 动态 增加 程序 数据 段 的 内 存 大 小 ， 








及 其 倍数 的 内 存 请 求 ( 按 页 分 配 )， 这 对 了 
(2) 系统 调用 申请 内 存 可 能 是 代价 昂贵 的 。 系 统 调用 可 能 涉及 














回 给 调用 者 。 当 程序 释 

















因 : 




















有 些 系统 的 系统 调用 只 支持 固定 大 小 
F 大 量 的 小 内 存 分 配 来 说 会 造成 浪费 。 




















户 态 和 核心 态 的 转换 。 


(3) 没有 管理 的 内 存 分 配 在 大 量 复杂 内 存 的 分 配 释放 操作 下 很 容易 造成 内 存 碎 片 。 


从 以 上 知识 可 知 ， 栈 是 系统 提供 的 功能 ， 








活 ; 而 堆 是 函数 库 提供 的 功能 , 特点 是 灵活 方便 ,数据 适应 面 广 泛 ， 





栈 是 系统 数据 结构 ， 对 于 进程 /线程 是 唯一 的 ; 堆 是 函数 库 内 


同 堆 分 配 的 内 存 无 法 互相 操作 。 














特点 是 快速 高 效 ， 缺 点 是 有 限制 ， 数 据 不 灵 


但 是 效率 有 一 定 降低 。 


部 数据 结构 ， 不 一 定 唯一 。 不 


栈 空间 分 静态 分 配 和 动态 分 配 两 种 。 前 态 分 配 是 编译 器 完 成 的 ， 如 自动 变量 (auto) 的 分 
配 。 动 态 分 配 由 calloc 函数 完成 。 栈 的 动态 分 配 无 需 释放 (是 自动 的 )， 因 此 没有 释放 函数 。 
为 可 移植 程序 起 见 ， 栈 的 动态 分 配 操 作 是 不 被 鼓励 的 堆 空 间 的 分 配 总 是 动态 的 ， 虽 然 程 
序 结束 时 所 有 的 数据 空间 都 会 被 释放 回 系 统 ;- 但 是 精确 地 申请 内 存 /释放 内 存 匹 配 是 良好 程 














序 的 基本 要 素 。 
3， 全 局 区 或 静态 区 




















C 语言 里 的 全 局 变量 和 静态 变量 存储 在 全 局 区 。 它 们 有 点 像 堆 上 的 空间 ， 也 持续 存在 





于 程序 的 整个 运行 期 间 汪 但 不 同 的 是 ， 它 们 是 由 编 详 器 自己 控制 分 配 和 释放 


4. 文字 常量 区 


人 


例如 ，chat*c= “123456”， 则 “123456” 为 文字 常量 ， 存 放 于 文字 常量 区 。 文 字 常量 





区 由 编译 器 控制 分 配 和 释放 。 下 面 我 们 给 出 两 个 应 用 栈 、 堆 、 常 

















关 例子 。 


例 2.1 相关 变量 的 赋值 与 堆栈 、 全 局 的 关系 。 


int a=0; 

char *pl; 

void main( ) 

六 
int b; 
char s[]="bb"; 
Char #p28 
char *p3="123"; 
static int c=0; 
pl=(char*)malloc(10); 
strcpy(pl, "123"); 


// 全 局 初始 化 区 
// 全 局 未 初始 化 区 


//"123\0" 在 常量 | 





量 区 来 分 配 内 存 空间 的 相 


又 





区 ，p3 在 栈 





// 全 局 区 


//10 个 字 节 区 域 在 堆 
/1"123\0" 在 常量 区 


区 








， 编 译 器 可 能 会 优 


化 为 和 p3 指向 同一 块 区 域 
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例 2.2 参数 与 变量 的 生命 周期 。 








2.2 结构 数组 、 结 构 指针 和 位 结构 
2.2.1 结构 数组 x NA 
多 数组 是 具有 相同 结构 关 要 量 人 人 < 修 各 要 定义 一 个 到 40 个 同学 的 如、 


性 别 、 年 龄 和 住址 ， 可 以 定义 成 一 个 结构 数组 ， 如 下 所 示 ; 





需要 指出 的 是 ， 结 构 数组 成 员 的 访问 是 以 数组 元 素 为 结构 变量 的 ， 其 形式 为 
结构 数组 元 素 .成 员 名 
例如 : 





实际 上 结构 数组 相当 于 一 个 二 维 构造 。 第 一 维 是 结构 数组 元 素 ， 每 个 元 素 是 一 个 结构 


变量 ， 第 二 维 是 结构 成 员 。 
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< 和光 注意 
结构 数组 的 成 员 也 可 以 是 数组 变量 。 | 


例如 : 





struct af 
nt ml3]15l 
float fr» 
char s[20]; 
}y[4]; 


为 了 访问 结构 a 中 的 结构 变量 y[2]， 可 写成 y[2].m[1][4]。 
2.2.2 ”结构 指针 


【参考 图 文 】 结构 指针 是 指向 结构 的 指针 。 它 由 一 个 加 在 结构 变量 名 前 的 “*” 操 作 符 来 定 
义 ， 例如， 用 前 面 已 说 明 的 结构 定义 一 个 结构 指针 


gw 
回 


struct string{ SN 三 
char name[8]; 


char sex[2]; 





int age; 
char addr[40]; 
}*student; -VV 
也 可 省 略 结构 指针 名 只 作 结 构 说 明 ， 然 后 用 下 面 的 语句 定义 结构 指针 : 
struct string *#student; Te YY 











使 用 结构 指针 对 结构 成 员 的 访问 ， 与 结构 变量 对 结构 成 员 的 访问 在 表达 方式 上 有 所 不 
同 。 结 构 指 针对 结构 成 员 的 访问 表示 为 

结构 指针 名 -> 结构 成 员 
其 中 ,“->” 是 两 个 符号 “-” 和 “>” 的 组 合 ， 好 像 一 个 箭头 指向 结构 成 员 。 例 如 ， 要 给 
上 面 定 义 的 结构 中 的 name 和 age 赋值 ， 可 以 用 下 面 语句 : 


























strcpy(student->name, "Lu G.C"); 
student->age=18; 
实际 上 ，student->name 就 是 (*student).name 的 缩写 形式 。 
需要 指出 的 是 , 结构 指针 是 指向 结构 的 一 个 指针 ， 即 结构 中 第 一 个 成 员 的 首 地 址 。 因 
此 ， 在 使 用 之 前 应 该 对 结构 指针 初始 化 ， 即 分 配 整个 结构 长 度 的 字 节 空 间 ， 这 可 用 下 面 函 
数 完成 ， 仍 以 上 例 来 说 明 : 


student=(struct string*)malloc(size of (struct string)); 


其 中 ，size of (struct string) 自 动 求 取 string 结构 的 字 节 长 度 ，malloc( ) 函数 定义 了 一 个 大 小 
为 结构 长 度 的 内 存 区 域 ， 然 后 将 其 地 址 作为 结构 指针 返回 。 


Es 
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(1) 结构 是 一 种 数据 类 型 ， 因 此 定义 的 结构 变量 或 结构 指针 变量 同样 有 局 部 变量 和 
全 程 变量 ， 视 定义 的 位 置 而 定 。 
(2) 结构 变量 名 不 是 指向 该 结构 的 地 址 ， 这 与 数组 名 的 含义 不 同 。 若 需要 求 结构 中 





第 一 个 成 员 的 首 地 址 ， 则 采用 “&[ 结 构 变 量 名 ]” 形 式 。 


榴 套 结构 是 指 在 一 个 结构 成 员 中 可 以 包括 其 他 结构 ，Turbo C 允许 这 种 棋 套 。 
例如 ， 下 面 是 一 个 有 堪 套 的 结构 : 


A 
其 中 ，addr 为 另 一 个 结构 的 结构 名 ， 必 须要 先 述 和 说 明 ， 印 


加 果 要 给 student 结构 中 成 员 address 绝 届 的 zipcode 赋值 ， 则 可 写成 





每 个 结构 成 员 名 从 最 外 层 直 到 最 内 层 逐 个 被 列 出 ， 即 嵌 套 结构 成 员 的 表达 方式 是 
结构 变量 名 . 嵌 套 结构 变量 名 .结构 成 员 名 
其 中 ， 嵌 套 结构 可 以 有 很 多 ， 结 构成 员 名 为 最 内 层 结构 中 不 是 结构 的 成 员 名 。 


2.2.3 ”位 结构 


位 结构 是 一 种 特殊 的 结构 ， 在 需 按 位 访问 一 个 字 节 或 字 的 多 个 位 时 ， 位 结构 比 按 位 运 
算 符 更 加 方便 。 
位 结构 定义 的 一 般 形 式 为 


其 中 ， 数 据 类 型 必须 是 int(unsigned 或 signed)。 整 型 常数 必须 是 非 负 的 整数 ， 范 围 是 0 一 


哆 
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15， 表 示 二 进 制 位 的 个 数 ， 即 表示 有 多 少 位 。 
变量 名 是 选择 项 ， 可 以 不 命名 ， 这 样 规定 是 为 了 排列 需要 。 例 如 ， 我 们 可 以 定义 如 下 
一 个 位 结构 : 


Et 
unsigned incon:8; /*incon 占用 低 字 节 的 0~7 位 ， 共 8 位 */ 
unsigned txcolor:4; /*txcolor 占用 高 字 节 的 0~3 位 ， 共 4 位 */ 
unsigned bgcolor:3; /*bgcolor 占用 高 字 节 的 4~6 位 ， 共 3 位 */ 





unsigned blink:1; /*blink 占用 高 字 节 的 第 7 位 */ 
}ch; 
位 结构 成 员 的 访问 与 结构 成 员 的 访问 相同 。 例 如 ， 访 问 上 例 位 结构 中 的 bgcolor 成 员 
可 写成 ; 
ch.bgcolor NA 六 
< 让 








(1) 位 结构 中 的 成 员 可 以 定义 为 unsigned， 也 可 定义 为 signed， 但 当成 员 长 度 为 1 
时 ， 会 被 认为 是 unsigned 类 型 ， 因 为 单个 位 不 可 能 具有 符号 。 

(2) 位 结构 中 的 成 员 不 能 使 用 数组 和 指针 ， 但 位 结构 变量 可 以 是 数组 和 指针 。 如 果 
位 结构 变量 是 指针 ， 其 成 员 访 问 方式 同 结构 指针 。 

(3) 位 结构 总 长 度 (位 数 ) 是 各 从 位 成 员 定义 的 位 数 之 和 ， 可 以 超过 两 个 字 节 。 

(4) 位 结构 成 员 可 以 与 其 他 结构 成 员 一 起 使 用 : 


例 2.3 定义 关于 工人 信息 的 结构 。 
struct info{ 入 上 总 


char name[8]; 

int age; 

struct addr address; 
float pay; 

unsigned state:1; 





unsigned pay:1; 


}workers; 

例 2.3 定义 了 关于 一 个 工人 信息 的 结构 。 其 中 有 两 个 位 结构 成 员 ， 每 个 位 结构 成 员 只 
有 一 位 ， 因 此 只 占 一 个 字 节 但 保存 了 两 个 信息 ， 该 字 节 中 第 一 位 表示 工人 的 状态 ， 第 二 位 
表示 工资 是 否 已 发 放 。 由 此 可 见 ， 使 用 位 结构 可 以 节省 存储 空间 。 





2.3 C 语言 常见 问题 分 析 








我 们 在 用 C 语言 编写 数据 结构 的 程序 时 总 会 出 现 这 样 或 那样 的 问题 , 现 将 针对 在 编程 
过 程 中 碰 到 的 问题 所 总 结 出 的 经 验 、 教 训 与 大 家 分 享 一 下 。 


2 











2.3.1 指针 和 数组 
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C 程序 中 ， 指 针 和 数组 在 不 少 地 方 可 以 相互 奉 换 使 用 ， 让 人 产生 一 种 错觉 ， 以 为 两 者 
是 等 价 的 ， 其 实 不 然 。 数 组 要 么 在 静态 存储 区 被 创建 (如 全 局 数组 )， 要 么 在 栈 上 被 创建 。 


数组 名 对 应 着 (而 不 是 指向 ) 一 
数组 的 内 容 可 以 改变 。 指 针 可 
常用 指针 来 操作 动态 内 存 。 
2.3.2 ”分 支 语 句 





许多 有 关 C 语言 的 书 中 者 
其 实 这 个 结论 并 不 完全 正确 ， 
它 的 效率 是 高 于 switch...case 





块 内 存 ， 其 地 址 与 容量 在 程序 运行 的 过 程 中 保持 不 变 ， 只 有 
以 随时 指向 任意 类 型 的 内 存 块 ， 它 的 特征 是 “可 变 ”， 所 以 








回 
说 过 , switch...case 的 效率 比 if...else if 的 效率 高 。 【参考 图 文 】 
关键 看 实际 代码 ， 少 数 情况 下 ， 如 果 让 ..else if 写法 得 当 ， 
的 。 





if...else 证 语句 测试 举例 妨 


void TestIfElse( ){ 
unsigned int x; 
srand(1); 
x=rand( )%100; 
if(x==0){ 


》 
else if(x==1){ 


Jelse{ 


} 
} 


0 下 : 


/* 初 始 化 随机 数 发 生 器 */ 


复制 代码 x 为 0 一 100 范围 内 的 随机 数 ， 当 x 不 为 0 和 1 时 执行 else 分支， 因此 上 面 
的 函数 有 98% 的 概率 是 执行 else 分 支 的 ， 而 执行 让 分 支 和 else 让 分 支 的 概率 各 为 1%。 在 


执行 else 分 支 时 ， 槛 先 执行 认 
内 容 。 因 此 执行 else 分 支 需要 


判断 语句 ， 青 执行 else 让 判断 语句 后 才 会 执行 else 分 支 中 的 
进行 两 次 判断 。 如 果 我 们 按 下 列 方式 将 else 分 支 的 执行 改 成 


放 到 让 里 面 去 执行 ， 则 效率 将 大 大 提高 。 


改进 后 的 代码 如 下 : 


void TestIfElseImp( ){ 
unsigned int x; 
srand( 1 ); 
x=rand( )%100; 
if(x>1){ 


lelse if(x==0){ 


/* 初 始 化 随机 数 发 生 器 */ 
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}else{ 


2.3.3 ”函数 编写 


函数 接口 的 两 个 要 素 是 参数 和 返回 值 ， 编 程 过 程 中 经 常 出 现 函数 功能 实现 没 问题 ， 但 





是 不 能 得 到 正确 的 返回 值 。 








(1) 函数 的 声明 。 参 数 的 书写 要 完整 ， 不 要 贪图 省 事 只 写 参数 的 类 型 而 省 略 参数 名 字 。 





如 果 函 数 没 有 参数 ， 则 用 void 填充 。 


void SetValue(int width, int height); // 我 们 经 常 使 用 的 格式 
void SetValue(int，int)7 // 不 良 攻 但 经 常 看 到 
float GetValue(void); // 良 好 的 辣 

float GetValue( ); // 不 良 的 风格 ， 但 经 常 使 用 


(2) 函数 的 返回 值 。C 语言 中 ， 凡 不 加 类 型 说 明 的 冰 数 ， 一 律 自动 按 整 型 处 理 。 经 常 


会 被 误解 为 void 类 型 。 有 的 函数 不 需要 返回 值 ， 但 为 了 增加 灵活 性 如 支持 链 式 表达 ， 可 以 
附加 返回 值 。 函 数 调用 结果 的 返回 可 以 通过 3 种 方式 实现 ,全 局 变量 、return 和 指针 参数 。 





(3) 通用 函数 是 指 能 够 被 用 在 各 种 情况 下 或 者 可 被 许多 不 同 程序 员 使 用 的 函数 。 我 





们 不 应 该 把 通用 函数 建立 在 全 局 变量 卡 (不 应 该 在 通用 函数 中 使 用 全 局 变量 )。 函 数 所 需要 
的 所 有 数据 都 应 该 用 参数 传递 (在 个 别 难以 这 样 做 的 情况 下 ， 可 以 使 用 静态 变量 )。 使 用 参 
数 传递 ， 除 了 有 助 于 函数 能 用 在 多 种 情况 下 之 外 ， 还 能 提高 函数 代码 的 可 读 性 。 不 用 全 局 
变量 ， 可 以 使 得 函数 减少 因 副 作用 而 导致 错误 的 可 能 性 。 

















(4) 函数 的 功能 要 单 二 ;不 要 设计 多 用 途 的 函数 。 

(5) 注意 函数 的 形 参 和 实 参 有 各 自 的 存储 单元 。 

(6) 函数 体 的 规模 要 小 。 一 般 尽 量 将 其 控制 在 50 行 代码 之 内 。 

(7) 尽量 避免 函数 带 有 “记忆 ”功能 ， 相 同 的 输入 应 当 产 生 相 同 的 输出 ， 带 有 “记忆 ” 








功能 的 函数 ， 其 行为 可 能 是 不 可 预测 的 ， 因 为 它 的 行为 可 能 取决 于 某 种 “记忆 状态 ” 这样 
的 函数 既 不 易 理 解 ， 又 不 利于 测试 和 维护 。 在 C/C++ 语 言 中 ， 函 数 的 static 局 部 变量 是 函 


数 的 “记忆 ”存储 器 。 建 议 尽量 少 用 static 局 部 变量 ， 除 非 必需 。 


性 ， 


2.3.4 void 及 void 指针 








(8) 不 仅 要 检查 输入 参数 的 有 效 性 ， 还 要 检查 通过 其 他 途径 进入 函数 体内 变量 的 有 效 
如 全 局 变量 、 文 件 句柄 等 。 
(9) 用 于 出 错 处 理 的 返回 值 一 定 要 清楚 ， 让 使 用 者 不 容易 忽视 或 误解 错误 的 情况 。 



































许多 初学 者 对 C/C++ 语言 中 的 void 及 void 指针 类 型 不 甚 理 解 ， 致 使 在 使 用 时 出 现 





些 不 必要 的 错误 。 接 下 来 将 对 void 关键 字 的 深刻 含义 进行 解说 ， 并 简 述 void 及 void 指针 
类 型 的 使 用 方法 和 技巧 。 


@, 





void 真正 的 作用 在 于 以 下 几 个 方面 。 
(1) 对 函数 返回 的 限定 。 
(2) 对 函数 参数 的 限定 。 

















众所周知 , 如 果 指 针 pl 和 p2 的 类 型 相同 , 那么 我 们 可 以 直接 在 pl 和 p2 间 互 相 赋值 
如 果 pl 和 p2 指向 不 同 的 数据 类 型 ， 则 必须 使 用 强制 类 型 转换 运算 符 把 赋值 运算 符 右边 的 


指针 类 型 转换 为 左边 的 指针 类 型 。 


而 void * 则 不 同 ， 任 何 类 型 的 指针 都 可 以 直接 赋值 给 它 
但 这 并 不 意味 着 ，void * 也 可 以 无 需 强 制 类 型 转换 地 赋 给 其 他 类 型 的 指针 。 因 为 “无 





时 第 章 重要 的 C 语 言 概念 


GO SS 


， 无 需 进行 强制 类 型 转换 。 


美 型 ”可 以 包容 “有 类 型 ” 而 “有 类 型 ” 则 不 能 包容 “无 类 型" 
下 面 给 出 void 关键 字 的 使 用 规则 。 














(1) 谨慎 使 用 void 指针 类 型 。 














按照 ANSIC 标准 ， 不 能 对 void 指针 进行 算法 操作 ， 即 下 列 操作 都 是 不 合法 的 : 


void * pvoid; 


pvoid+t+; //ANSI C: 错误 
pvoid += 1; //ANSI C: 错误 


5 
险 
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ANSI C 标准 之 所 以 这 样 认定 ， 是 因为 它 坚持 进行 算法 操作 的 指针 必须 是 确定 知道 其 


指向 数据 类 型 大 小 的 。 


(2) 如 果 函 数 的 参数 可 以 是 任意 类 型 指针 ， 那 各 应 声明 其 参数 为 void *。 
典型 的 如 内 存 操作 函数 memepy 和 memset， 其 函数 原型 分 别 为 : 


void * memcpy(void *dest, const \ void SEC1 Size t len)s 


void * memset ( void * buffer, int cy size t num )7 


这 样 ， 任 何 类 型 的 指针 都 可 以 传 入 memcpy 和 meniset 中 ， 这 也 真实 地 体现 了 内 存 操 
作 函 数 的 意义 ， 因 为 它 操作 的 对 象 仅仅 是 一 片 内 存 ; 而 不 论 这 片 内 存 是 什么 类 型 。 
(3) void 不 能 代表 一 个 真实 的 变量 。 


下 面 的 代码 企图 让 void 代表 一 


void a; ee // 错 误 
function(void a); // 错 误 


个 真实 的 变量 ， 因 此 是 错误 的 代码 : 


void 的 出 现 只 是 为 了 一 种 抽象 的 需要 ， 如 果 正 确 地 理解 了 面向 对 象 中 “抽象 基 类 ”的 


概念 ， 也 很 容易 理解 void 数据 类 型 。 


正如 不 能 给 抽象 基 类 定义 一 





一 个 void( 让 我 们 类 比 地 称 void 为 “抽象 数据 类 型 ”) 变 量 。 


2.3.5 关于 C 语言 的 高 效 编程 


写 高 效 简洁 的 C 语言 代码 是 许多 软件 工程 师 追 求 的 目标 。 本 文 就 工作 中 


eg 不 妥 之 处 请 读者 指教 。 


方法 1 数学 方法 解决 问题 


个 实例 ， 我 们 








也 不 能 定义 


ba 


的 一 些 体会 





数学 是 计算 机 之 母 ， 没 有 数学 作为 依据 和 基础 就 没有 计算 机 的 发 展 ， 所 以 在 编写 程序 
的 时 候 ， 采 用 一 些 数学 方法 会 对 程序 的 执行 效率 有 数量 级 的 提高 。 
例 2.4 求 1 一 100 之 和 的 实现 代码 1。 


所 


办 
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for(i=1;i<=100;i++) 

{ 


j=i; 


} 
例 2.5 求 1 一 100 之 和 的 实现 代码 2。 





int i; 
i=(100 *(1+100)/2; 


例 2.4 循环 了 100 次 才 解 决 问题 ， 也 就 是 说 最 少 进 行 了 100 次 赋值 、100 次 判断 、200 
次 加 法 (i 和 j; 而 例 2.5 采用 公式 NGN+1)/2 求解 ， 仅 进行 了 1 次 加 法 、1 次 乘法 次 、1 次 除 
法 。 效 果 自 然 不 言 而 喻 。 所 以 ， 在 编程 序 的 时 候 ， 要 多 动脑 筋 找 规律 ， 最 大 限度 地 发 挥 数 
学 的 威力 来 提高 程序 运行 的 效率 。 

方法 2 使 用 位 操作 

在 计算 机 程序 中 ， 数据 的 位 是 可 以 操作 的 最 小 数据 单位 ;理论 上 可 以 用 “位 运算 ”来 
完成 所 有 的 运算 和 操作 。 一 般 的 位 操作 是 用 米 控 制 硬件 的 ”或 者 作 数据 变换 使 用 ， 但 是 
灵活 的 位 操作 可 以 有 效 地 提高 和 和 条 的 芝 二 > 下 

例 2.6 位 操作 实现 代码 1。 


ne 
I=257/8; \ 
J=456%32; Sh.N 


例 2.7 位 操作 实现 代码 2。 
DA 1 Ww 
int IT l 
2 站 
I=257>>37 六 D2 
J=456-(456>>5<<5); 


表面 看 来 例 2.7 比例 2.6 麻烦 了 很 多 ， 但 是 ， 仔 细 查 看 产生 的 汇编 代码 就 会 明白 ， 例 
2.6 调用 了 基本 的 取 模 函数 和 除法 函数 ， 既 有 函数 调用 ， 又 有 很 多 汇编 代码 和 寄存 器 参与 
运算 ， 而 例 2.7 则 仅仅 是 儿 名 相关 的 汇编 代码 ， 更 简洁 ， 效 率 更 高 。 当 然 ， 由 于 编译 器 的 
不 同 ， 可 能 效率 的 差距 不 大 ， 但 是 ， 以 我 们 目前 遇 到 的 MS C、ARM C 来 看 ， 效 率 的 差距 
还 是 不 小 。 相 关 汇编 代码 不 在 这 里 列举 。 

运用 这 个 方法 需要 注意 因为 CPU 的 不 同 而 产生 的 问题 。 例 如 ， 在 PC 上 用 这 个 方法 编 
写 的 程序 ， 并 在 PC 上 调试 通过 ， 当 移植 到 一 个 16 位 机 平台 上 时 ， 可 能 会 产生 代码 隐患 。 
所 以 只 有 在 一 定 技术 进 阶 的 基础 下 才 可 以 使 用 此 法 。 

方法 3 汇编 嵌入 

“在 熟悉 汇编 语言 的 人 眼 里 ，C 语言 编写 的 程序 都 是 垃圾 。” 这 种 说 法 虽然 偏激 了 一 
些 ， 但 是 有 它 的 道理 。 汇 编 语言 是 效率 最 高 的 计算 机 语言 ， 但 是 ， 不 可 能 依靠 它 来 写 一 
个 操作 系统 。 所 以 ， 为 了 获得 程序 的 高 效率 ， 我 们 只 好 采用 变通 的 方法 一 一 嵌入 汇编 ， 
混合 编程 。 
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2.3.6 ”其 他 若干 问题 

1. 变量 定义 的 次 序 

最 好 把 同类 型 的 定义 在 一 起 , 最 好 把 长 度 小 的 定义 在 前 面 , 这 样 可 以 优化 存储 器 布局 ， 
有 可 能 节约 空间 ， 特 别 是 在 嵌入 式 系统 存储 器 比较 紧张 的 情况 下 更 是 如 此 。 

2.const 修饰 变量 


const char*p; // 指 向 常量 的 指针 ， 内 容 不 可 变 ， 但 指针 可 以 变 
char*const Pi; // 指 针 为 常量 ， 不 可 变 ， 但 内 容 可 以 变 
3， 循 环 的 使 用 


工 套 循环 中 尽量 将 循环 次 数 少 的 循环 作为 外 循环 ,这样 可 以 减 钞 CPU 跨 切 循环 层 的 次 数 。 

对 一 个 数组 进行 循环 时 ， 一 般 来 说 ， 如 果 每 轮 循环 都 是 在 循环 处 理 完 后 循环 变量 才 增 
加 ， 则 使 用 for 循环 比较 方便 ; 如 果 循 环 变量 在 循环 处 理 的 过 程 中 增加 ， 则 使 用 while 循环 
比较 方便 ， 另 外 ， 在 使 用 for 循环 语句 时 ， 如 果 里 面 的 循环 条 件 很 长 ， 可 以 考虑 用 while 
循环 进行 替代 ， 使 代码 的 排版 格式 好 看 一 些 。 、 


N23 
while 循环 里 的 条 件 被 看 成 表达 式 ; 有 也 工具 软件 可 能 会 提示 出 错 了 ,因此 构造 死 循 









































环 时 最 好 使 用 for( ; ; ) 来 进行， i~ 


4. 比较 语句 


比较 语句 中 ， 千 方 要 留意 无 论 是 foat 还 是 .double 类 型 的 变量 都 有 精度 限制 ， 所 以 一 
定 要 避免 将 浮 点 变量 用 “一 ”或 “=” 与 数字 比较 ， 应 该 设法 转化 成 “>=” 或 “<= ”形式 。 


本 章 小 结 


本 章 主要 对 C 语言 的 有 关 知 识 进行 简介 , 进一步 加 深 对 静态 内 存 分 配 、 动 态 内 存 分 配 、 
结构 数组 、 结 构 指针 、 位 结构 和 C 语言 常见 问题 等 知识 点 的 理解 。 

静态 分 配 是 编译 器 在 处 理 程序 源 代码 时 分 配 的， 动态 分 配 是 程序 在 执行 时 申请 分 配 
的 ， 静态 内 存 分 配 是 在 程序 执行 之 前 进行 的 ， 因 而 效率 比较 高 ， 而 动态 内 存 分 配 则 可 以 灵 
活 地 处 理 未 知 数目 的 变量 。 静 态 内 存 分 配 与 动态 内 存 分 配 的 主要 区 别 是 静态 对 象 是 有 名 字 
的 变量 ， 可 以 直接 对 其 进行 操作 ， 动 态 对 象 是 没有 名 字 的 变量 ， 需 要 通过 指针 间接 地 对 它 
进行 操作 。 静 态 对 象 的 分 配 与 释放 由 编译 器 自动 处 理 ;动态 对 象 的 分 配 与 释放 必须 由 程序 
员 显 式 地 管理 ， 它 通过 malloc 和 free 两 个 函数 (C++ 中 为 new 和 delete 运算 符 ) 来 完成 。 
结构 数组 就 是 具有 相同 结构 类 型 的 变量 集合 。 结 构 指 针 是 指向 结构 的 指针 ， 由 一 个 加 
在 结构 变量 名 前 的 “*” 操 作 符 来 定义 。 而 位 结构 是 一 种 特殊 的 结构 ， 在 需 按 位 访问 一 个 字 
节 或 字 的 多 个 位 时 ， 位 结构 比 按 位 运算 符 更 加 方便 。 总 之 ， 学 习 本 章 可 为 以 后 的 学 习 打 下 
坚实 基础 ， 并 对 学 习 数据 结构 的 其 他 各 章节 有 很 大 的 帮助 。 
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习题 与 思考 

2.1 单 选 题 
1， 一 个 数组 元 素 a 中 与 ( ) 的 表示 等 价 。 

A. *(ati) B: a Cs 党 富村 D. &ati 
2. 一 个 C 语 言 程序 由 ( ”) 组 成 。 

A， 若干 函数 B. 一 个 主 程序 和 若干 子 程序 

C, 若干 过 程 D. 若干 子 程序 
3. 为 了 避免 在 嵌 套 的 条 件 语 句 让 ..else 中 产生 二 义 性 ,C 语 言 规定 else 子 句 总 是 与 ( 

配对 。 

A. 缩 排 位 置 相同 的 B. 其 之 前 最 近 的 未 配对 证 

C. 其 之 后 最 近 的 让 D. 同一 行 上 的 这 
4. ee 证 语句 中 的 判断 表达 式 ( )。 、 

只 能 用 关系 表达 式 B. 只 能 用 由 辑 表 达 式 

















只 能 是 关系 表达 式 或 多 得 表达 式 、 RD 可 以 是 任何 类 型 表达 式 
5. et 


struct student XN | 
{int age; >» op 
WS wx 
int num; = 所 六 Ve 
}std *p;p=&std; > 起 wd 
则 以 下 对 结构 体 变量 实体 让 中 成 员 age 的 引用 方式 不 正确 的 是 ( 。 )。 
A. std.age” A B. p>age x C. (*p).age D. *p.age 
2.2 填空 题 ， : 


1. 车 有 定义 int a=2;char b='b';double x=1.0;float y=3， 则 sizeof(a)， 
sizeof(b)，sizeof(x)，sizeof(y)，sizeof(1+2)，sizeof(long) 的 值 分 别 是 











2. 多 分 支 选择 除了 可 以 使 用 开关 语句 ( 即 switch 语句 ) 外 ,还 可 以 用 幸 套 的 
实现 。 

3. 常 对 数组 进行 的 两 种 基本 操作 是 

4. 设 有 说 明 语 句 char *str="\t\' a ， 则 指针 str 所 指 字符 串 的 











来 











长 度 为 ” 。 
5. 车 有 定义 int x[10];*p=x;， 则 *(p+5) 表 示 . 
2.3 思考 题 


1. 结构 类 型 与 结构 变量 有 何不 同 ? 

.结构 类 型 成 员 是 否 可 以 是 一 个 结构 变量 ? 其 能 否 与 程序 中 的 变量 同名 ? 
结构 数组 与 普通 数组 有 何不 同 ? 

用 来 指向 一 个 结构 变量 的 指针 变量 的 值 是 哪个 变量 的 起 始 地 址 ? 

.如 何 用 指针 指向 结构 数组 中 的 元 素 ? 
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6. 将 一 个 结构 变量 的 值 传递 给 另 一 个 函数 有 几 种 方法 ? 

7. 联合 类 型 与 结构 类 型 有 何不 同 ? 

8. 联合 类 型 能 否 出 现在 结构 类 型 定义 中 ? 

9. 试 分 别 输出 long int、int、char、bool、float、double 和 long double 的 字符 长 度 和 位 
数 。 输 出 形式 如 下 : 


long int: 4byte 32bit 


10. 我 们 知道 ， 引 入 指针 数组 的 目的 是 便于 管理 同类 指针 。 例 如 ， 用 指针 数组 能 比较 
方便 地 处 理 众多 的 字符 串 。 为 此 ， 请 从 键盘 输入 名 字 表 ， 然 后 按 字符 串 从 小 到 大 的 顺序 输 
出 名 字 表 。 

11， 技 出 一 个 整数 算 阵 中 的 鞍点 。 数 组 中 鞍点 位 置 上 的 元 素 ， 其 值 在 其 行 中 最 大 ， 而 
在 其 列 中 最 小 。 注 意 ， 算 阵 中 可 能 没有 鞍点 。 KA 

12. 写 出 一 个 函数 的 原型 ， 要 求 其 参数 为 一 个 指向 字符 六 数据 的 指针 数组 ， 无 返回 值 。 

13。 输入 一 行 字符 吊 ， 找 出 其 中 大 写字 母 、 小 写字 母 、 空格 、 数 字 及 其 他 字符 各 有 多 少 。 

14、 中 国有 锯 俗语“ 三 天 打 鱼 ， 两 天 晒 网 ”， 某 大 从 2000 年 1 月 1 号 起 开始 “三 天 打 
鱼 ， 两 天 晒 网 ” 则 这 个 人 在 以 后 的 某 一 天 是 在 * 打 鱼 "”， 还 是 在 “ 晒 网 ”。 

提示 : 为 了 判断 这 个 人 在 哪 一 天 是 在 必 打 鱼 ”， 还 是 在 “ 晒 网 ”首先 要 求 出 从 2000 
年 1 月 1 号 起 到 指定 的 日 期 共有 多 少 天 区 将 总 天 数 被 5 取 余 后 ， 就 可 以 从 余数 中 判断 。 要 
求 用 数据 保存 平 、 间 年 每 月 的 天 数 。 “1 和 

15， 利 用 结构 变量 求解 如 下 两 个 复数 之 积 。 。 ” 学、 

(D) (3+4)x(5+6); 2 , 人 人 

O) (0+ 20Dx(30+40D。 | 

16. 用 结构 指针 修改 “三 天 打 鱼 ， 两 天 二 网” 的 得 序 
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线 性 表 


(1) 掌握 线性 表 的 逻辑 结构 及 特性 。 
(2) 掌握 两 类 存储 结构 的 描述 方法 及 实现 。 


线性 表 的 概念 











应 用 实践 


链表 是 本 章 的 重点 和 难点 。 掌 握 指 针 操 作 和 内 存 动态 分 配 的 编程 技术 是 学 好 本 章 的 基 
本 要 求 ， 分 清 链表 中 指针 P 和 结 点 *p 之 间 的 对 应 关系 ， 区 分 链表 中 的 头 结 点 、 头 指针 和 
首 结 点 的 不 同 ， 熟 练 掌握 循环 链表 、 双 向 链表 。 


学 习 数据 结构 的 目标 是 编 出 质量 更 高 的 程序 ， 因 此 重 在 “实践 ”。 本 章 讨论 的 线性 表 
是 我 们 将 要 学 习 的 第 一 种 也 是 最 简单 的 一 种 数据 结构 ， 是 整个 课程 的 基础 ， 特 别 是 熟练 党 
握 链表 的 操作 对 以 后 各 章 的 学 习 将 有 很 大 的 帮助 。 


人 线 性 表 
6 i 


3.1 线性 表 的 概念 





3.1.1 线性 表 的 定义 
线性 表 是 最 常用 且 最 简单 的 数据 结构 。 简 言 之 ， 一 个 线性 表 是 n 个 数据 元 素 的 有 限 序 
列 。 每 个 数据 元 素 的 具体 含义 在 不 同情 况 下 各 不 相同 ， 它 可 以 是 一 个 数 或 一 个 符号 ， 也 可 
以 是 一 页 书 ， 甚 至 其 他 更 复杂 的 信息 。 
线性 表 也 是 许多 实际 应 用 领域 表 结构 的 抽象 形式 ， 其 可 以 用 一 个 标识 符 来 命名 ， 如 
L 命名 线性 表 : 









































L=(ai, az ab ai, al an) 网 
其 中 ，n 为 表 长 ，n = 0 时 为 空 表 ， 而 数据 元 素 ai 只 是 一 个 抽象 符号 = 
线性 表 的 逻辑 结构 特征 如 下 。 AN 
(1) 有 且 仅 有 一 个 起 始 结 点 aa， 没 有 直接 前 趋 ， 有 上 且 仅 有 一 个 直接 后 继 az。 
(2) 有 且 仅 有 一 个 终结 结 点 as， 没有 直接 后 继 有 上 且 仅 有 一 个 直接 前 趋 ai。 
(3) 其 余 的 内 部 结 点 a(2<i<n-1) 都 有 且 仅 有 一 个 直接 前 趋 a- 和 一 个 直接 后 继 ai。 
所 以 线性 表 是 一 个 线性 结构 ， 用 二 元 组 表示 为 ~ 
LD, R) 























对 应 的 迎 辑 结构 如 图 3.1 所 示 。 


3.1 线性 表 的 去 辑 结构 示意 图 


3.1.2 ”线性 表 的 抽象 数据 类 型 描述 
线性 表 是 一 个 相当 灵活 的 数据 结构 ， 它 的 长 度 可 根据 需要 增长 或 缩短 ， 即 对 线性 表 的 
数据 元 素 不 仅 可 以 进行 访问 ， 还 可 以 进行 插入 和 删除 等 操作 。 





其 抽象 数据 类 型 的 定义 如 下 。 
ADT List { 
数据 对 象 : D 二 { ai | ai EElemType, i=1,2,...,n, n>=0} 
//ElemType 是 自 定义 的 类 型 标识 符 
数据 关系 : R ={ <ai-i ,ai >1ai-l ,aiED, i=2,...1n } 
基本 操作 如 下 。 
InitList(SqList *L ) // 线 性 表 的 初始 化 ， 即 构造 一 个 空 的 线性 表 工 
// 释 放 线 性 表 工 占用 的 内 存 空间 


DestroyList(SqList gL ) 
ListEmpty(SqList 工 ) // 判 断 线 性 表 工 是否 为 空 表 
ListLength(SqList 工 ) // 求 线性 表 的 长 度 ， 返 回 工 中 元 素 个 数 
GetElem(SqList L,int i,DataType*e)  // 求 线性 表 工 中 第 i(1<=i<=n) 个 元 素 的 值 


只 
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C 
LocateElem(SqList L,DataType e) // 返 回 工 中 第 1 个 与 e 满足 关系 的 数据 元 素 位 序 
ListTraverse(SqList LT) // 依 次 对 线性 表 工 的 每 个 元 素 进行 遍历 
ClearList(SqList *L ) // 将 线性 表 工 重 置 为 空 表 


PutElem(SqList Lvint i, DataType *e) // 给 线性 表 工 中 第 i 个 元 素 赋值 
ListInsert(SqList *L,int i,DataType e) 

// 在 线性 表 工 的 第 i 个 元 素 之 前 插入 新 的 元 素 e 
ListDelete(SqList *L, int i, DataType *e) 

// 删 除 工 的 第 主 个 元 素 ， 并 用 e 返回 其 值 ，L 的 长 度 减 1 
CreateListHead(SqList *L，int n) // 用 头 插 法 建立 带 表 头 结 点 的 单 链 线性 表 工 
CreateListTail(SqList *L，int n) // 用 尾 插 法 建立 带 表 头 结 点 的 单 链 线性 表 工 

} ADT List 





3.2 顺序 表 


3.2.1 顺序 表 的 定义 


线性 表 的 顺序 存储 结构 是 指 用 一 块 地 址 连续 的 存储 空间 依次 存储 线性 表 的 数据 元 素 。 
这 种 存储 结构 称 为 顺序 表 , 也 称 为 向 量 。 每 个 表 的 元 素 称 为 这 个 顺序 表 或 向 量 的 一 个 分 量 。 

顺序 表 的 特点 如 下 。 SA 

(1) 在 顺序 表 上 ， 逻 辑 关 系 相 邻 的 两 个 元 素 在 物理 位 置 上 也 相 邻 。 

(2) 在 顺序 表 上 可 以 随机 存 取 表 中 的 元 素 。 | 

如 果 已 知 顺序 表 第 一 个 元 素 的 地 址 和 每 个 元 素 占用 的 存储 单元 数 ， 由 任 一 元 素 的 序号 
就 可 以 计算 出 该 元 素 在 内 存 中 的 地 址 。 

设 线性 表 的 每 个 元 素 占 用 d 个 存储 单元 ”并 以 所 占 的 第 一 个 单元 的 存储 地 址 作为 数据 
元 素 的 存储 位 置 ， 则 线性 表 中 第 it1 个 数据 元 素 的 存储 位 置 LOC(atD) 和 第 i 个 数据 元 素 的 
存储 位 置 LOC(aij 之 间 满 足下 列 关系 : 

LOC(ain)= LOC(ai)+d 
一 般 来 说 ， 线 性 表 的 第 i 个 数据 元 素 ai 的 存储 位 置 为 
LOC(ai)= LOC(a)+(i-1)xd 

其 中 ，LOC(a1) 是 线性 表 的 第 一 个 数据 元 素 ai 的 存储 位 置 ， 通 常 称 作 线性 表 的 起 始 位 置 或 
基地 址 。 
在 程序 设计 语言 中 ， 一 维 数组 在 内 存 中 占用 的 存储 空间 就 是 一 组 连续 的 存储 区 域 ， 可 
见 ， 维 数组 来 表示 顺序 表 的 数据 存储 区 域 是 再 合适 不 过 的 。 
考虑 到 线性 表 的 运算 有 插入 、 删 除 等 运算 ， 即 表 长 是 可 变 的 ， 数 组 的 容量 需 设 计 得 足 
够 大 ， 设 用 data[MAXSIZE] 来 表示 ， 其 中 MAXSIZE 是 一 个 根据 实际 问题 定义 的 足够 大 的 
整数 ， 线 性 表 中 的 数据 从 data[0] 开 始 一 次 存放 ， 但 当前 线性 表 中 最 后 一 个 元 素 的 实际 元 素 
个 数 可 能 未 达到 MAXSIZE， 需 要 一 个 变量 length 记录 当前 线性 表 中 最 后 一 个 元 素 在 数组 
中 的 位 置 ， 即 length 起 一 个 指针 的 作用 ， 始 终 指向 线性 表 中 最 后 一 个 元 素 。 其 顺序 表 结 构 如 
图 3.2 所 示 。 
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图 3.2 顺序 表 结 构 
在 C 语 言 中 ， 顺 序 表 的 类 型 定义 如 下 。 
typedef int DataType; //DataType 类 型 根据 实际 情况 而 定 ， 这 里 假设 为 int 
#define MAXSIZE 100 //MAXSIZE 可 根据 实际 情况 而 定 
typedef struct{ 
DataType data[MAXSIZE]; 


int length; 
}SqList; A 


3.2.2 ”顺序 表 的 基本 运算 





1， 线 性 表 中 数据 元 素 的 插入 站 

线性 表 的 插入 操作 是 指 在 线性 表 的 第 i-1 个 数据 元 素 和 第 i 个 数据 元 素 之 间 插 入 一 个 
新 的 数据 元 素 b， 就 是 使 长 度 为 n 的 线性 表 一、 

(a dz, aa 
变 成 长 度 为 ntl 的 线性 表 Ns 
aa aa 

数据 元 素 ar 和 ai 的 逻辑 关系 发 生 了 变化 立 在 线性 表 的 顺序 存储 结构 中 ， 由 于 轴 辑 上 
相 邻 的 数据 元 素 在 物理 上 也 是 相 邻 的 ， 因 此 除非 1= n + 1， 和 否则 必须 移动 元 素 才能 反映 
这 个 逻辑 关系 的 变化 。 图 3.3 表示 一 个 线性 表 在 进行 插入 操作 的 前 后 其 数据 元 素 在 存储 空 
间 中 位 置 的 变化 。 

















插入 27 





图 3.3 ”线性 表 插入 前 后 的 状况 
一 般 情况 下 ,在 第 i(1<i<n) 个 数据 元 素 之 前 插入 一 个 元 素 时 , 需要 将 n 至 第 i 个 元 素 
( 共 mri+l 个 ) 依 次 向 后 移动 一 个 位 置 ， 其 实现 算法 如 下 。 
算法 3.1 顺序 表 的 插入 


int ListInsert(SqList *L,int i,DataType e){ 
int k; 
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2， 线 性 表 中 数据 元 素 的 删除 
线性 表 的 删除 操作 是 使 长 度 为 n 的 线性 表 。 。 


(a1, az，… a By 
变 成 长 度 为 a-1 的 线性 表 ,A 
(au a2, NAS aitl, an) 
数据 元 素 sr、a% 和 ai 之 问 的 过 辑 关系 发 生变 化 ， 为 了 在 存储 结构 上 反映 这 些 变化 ， 
同样 需要 移动 元 素 ， 如 图 34 所 示 、 ,A 


4 KaAd 

序号 数 SC 序号 数据 
~ — 元 素 N 六 元 类 
XK 0 [a > 0 [24| 

NV ,M2 ~ 
AN 一 一 1 / 1 [ao 
2 [30 2 | 2 
3 | 2 3 | 2 
4 [3 
| | | 


图 3.4 线性 表 删 除 前 后 的 状况 


一 般 情 况 下 , 删除 第 i1 入 ji 乏 癌 个 元 素 时 需 将 从 第 计 1 盏 第 n( 共 ni) 个 元 素 依次 向 前 移 
动 一 个 位 置 ， 算 法 如 下 。 
算法 3.2 ”顺序 表 的 删除 


er 


© ey 


for(k=i;k<L->length; k++) 
L->data[k-1]=L->data[k]; 


*e=L->data[i-1]; 
if (i<L->length) 
{ 


} 
L->length--; 
return OK; 





3.3 单 向 链表 


3.3.1 单 向 链表 的 基本 概念 


顺序 表 的 存储 特点 是 用 物理 上 的 相 邻 来 实现 逻辑 上 的 相 邻 、 它 要 求 用 连续 的 存储 单元 
顺序 存储 线性 表 中 各 元 素 ， 因 此 ， 对 顺序 表 插 入 、 删 除 时 需要 通过 移动 数据 元 素来 实现 ， 
这 影响 了 运行 效率 。 线 性 链表 不 需要 用 地 址 连续 的 存储 单元 来 实现 ， 而 是 通过 “ 链 ” 建 立 
起 数据 元 素 之 间 的 逻辑 结构 ， 显 然 ， 对 线性 表 的 插入 、 删 除 不 需要 移动 数据 元 素 。 

以 链 式 结构 存储 的 线性 表 称 为 线性 链表 。 线 性 链表 的 特点 是 表 中 数据 元 素 可 以 用 任意 
的 存储 单元 来 存储 。 线 性 链表 中 迪 辑 相 邻 的 两 元 素 的 存储 空间 可 以 是 不 连续 的 。 为 表示 风 
辑 上 的 顺序 关系 ， 对 表 的 每 个 数据 元 素 除 存储 本 身 的 信息 之 外 ， 还 需 存储 一 个 指示 其 直接 
后 继 的 信息 。 这 两 部 分 信息 组 成 数据 元 素 的 存储 映像 … 称 为 结 点 。 由 于 这 种 链表 的 每 个 结 
点 只 有 一 个 指示 其 直接 后 继 的 信息 ， 故 将 这 种 链表 称 为 单 向 链表 ， 简 称 为 单 链表 。 


3.3.2 单 向 链表 的 存储 表示 


数据 结构 在 计算 机 中 的 表示 称 为 物理 结构 ， 又 称 存储 结构 。 单 向 链表 结 点 的 数据 结构 
数据 域 和 指针 域 构成 。 

(1) 数据 域 ， 存 储 元 素数 据 信 息 ; 

(2) 指针 域 :存储 直接 后 继 的 存储 位 置 (地 址 )。 

单 向 链表 结 点 可 以 很 形象 地 表示 为 图 3.5 所 示 的 结构 。 

| 娄 所 | 后 维 地 址 | 
图 3.5 单 向 链表 结 点 的 结构 

n 个 结 点 (a(1<i<n) 的 存储 映像) 链接 成 一 个 链表 , 即 为 线性 表 (a1 a2,…, an) 的 链 式 存储 
结构 。 整 个 链表 的 存 取 必 须 从 头 指针 开始 进行 ， 头 指针 指示 链表 中 第 一 个 结 点 (第 一 个 数据 
元 素 的 存储 映像) 的 存储 位 置 。 同 时 ， 由 于 最 后 一 个 数据 元 素 没有 直接 后 继 ， 则 线性 链表 中 
最 后 一 个 结 点 的 指针 为 空 NULL)。 

知识 链接 


(1) 前 驱 地 址 : 上 一 个 元 素 的 存储 地 址 。 





















































(2) 后 继 地 址 : 下 一 个 元 素 的 存储 地 址 。 
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用 C 语言 定义 的 单 向 链表 结构 如 下 : 


typedef struct Node 
DataType data; 
struct Node *next; 
}Node; 
typedef struct Node *LinkList; 


假设 工 是 LinkList 型 的 变量 , 则 工 为 单 向 链表 的 头 指针 ， 它 指向 表 中 第 一 个 结 点 。 若 工 
为 空 (NULL)， 则 所 表示 的 线性 表 为 “ 空 ” 表 ， 其 长 度 n 为 “ 零 ”。 有 了 时， 我 们 在 单 向 链表 
的 第 一 个 结 点 之 前 附设 一 个 结 点 ， 称 为 “ 头 结 点 ”。 头 结 点 的 数据 域 可 以 不 存储 任何 信息 ， 
也 可 以 存储 诸如 线性 表 的 长 度 等 类 的 附加 信息 ， 头 结 点 的 指针 域 存储 指向 第 一 个 结 点 的 指 
针 ( 第 一 个 元 素 结 点 的 存储 位 置 )。 如 图 3.6(a) 所 示 ， 此 时 ， 单 向 链表 的 头 指针 指向 头 结 点 。 
车 线性 表 为 空 表 ， 则 头 结 点 的 指针 域 为 “ 空 ”， 如 图 3.6(b) 所 示 。 


-一 天 了 al 于 一 a 十 … 一 [a]*] L 绣 四 
(a) 非 空 表 (b) 空 表 
3.6 ”带头 指针 的 单 向 链表 











3.3.3 单 向 链表 的 基本 操作 


一 般 情况 下 ， 一 个 单 向 链表 需要 创建 操作 (初始 化 分 配 内 存 的 操作 )、 销 毁 操 作 (释放 整 
个 链表 的 所 有 结 点 及 结 点 数据 的 内 存 操作 )。 此 外 ,> 我 们 经 常 碰 到 的 栈 操作 、 队 列 操作 等 方 
面 的 功能 都 要 放 到 这 里 来 实现 ， 还 有 获取 某 个 位 置 上 的 结 点 数据 、 链 表 结 点 数量 等 操作 。 

对 于 链表 的 栈 操作 ， 可 以 通过 将 结 点 添加 在 链表 尾部 来 实现 压 栈 操作 ， 通 过 弹出 链表 
的 头 结 点 来 实现 出 栈 操作 。 队 列 操作 和 栈 操作 差不多 ， 可 以 通过 从 链表 尾部 添加 结 点 ， 从 
头 部 弹出 结 点 来 实现 。 那 么 可 和 否 从 尾部 弹出 结 点 呢 ? 如 果 从 尾部 弹出 结 点 ， 需 要 先知 道 尾 
部 结 点 的 上 一 个 结 点 ， 还 要 将 这 个 结 点 的 下 一 结 点 指针 赋 为 NULL。 但 单 向 链表 没有 前 向 
指针 ， 所 以 要 得 到 这 个 结 点 具 能 从 链表 头 部 去 搜索 ， 这 样 效 率 太 低 了 。 因 此 ， 单 向 链表 不 
能 从 尾部 弹出 结 点 。 
向 链表 与 顺序 表 不 同 ， 顺 序 表 在 建立 时 ， 已 定义 好 此 顺序 表 的 界限 ， 并 分 配给 它 一 
块 连续 的 存储 单元 ， 而 单 向 链表 的 结 点 数 在 定义 前 是 不 确定 的 ， 单 向 链表 中 的 元 素 也 不 一 
定 是 顺序 安排 的 ， 而 是 由 指针 域 来 表示 各 元 素 的 前 后 邻接 关系 ， 故 单 向 链表 的 运算 操作 与 
顺序 表 一 般 有 所 不 同 。 单 向 链表 的 常用 运算 主要 有 遍历 、 插 入 和 删除 等 。 所 谓 遍历 ， 就 是 
根据 已 给 的 表 头 指针 ， 按 由 前 向 后 的 次 序 访问 单 链表 的 各 个 结 点 。 

单 向 链表 的 基本 操作 如 下 。 




















世 




















InitList(LinkList *L) // 初 始 化 单 向 链表 
ListEmpty(LinkList L) 7/ 判断 单 向 链表 是 否 为 空 
ClearList(LinkList *L) // 单 向 链表 的 置 空 
CreateListTail(LinkList *L, int n) // 从 尾 创 建 添加 结 点 
CreateListHead(LinkList *L, int n) // 从 头 创建 添加 结 点 
ListLength(LinkList LI) // 获 取 单 向 链表 结 点 数量 ( 表 长 ) 


所 第 3 章 线性 表 





下 面 给 出 单 向 链表 这 些 基本 函数 的 实现 编码 。 
1， 初始 化 单 向 链表 
算法 3.3 ”初始 化 单 向 链表 








2 判断 单 向 链表 是 否 为 空 Ve 


若 工 为 空 表 ， 则 返回 TRUE， 
算法 3.4 ”判断 单 向 链表 是 否 为: 





3， 单 向 链表 的 置 空 
算法 3.5 单 向 链表 的 置 空 
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4. 求 表 长 
算法 3.6 求 单 向 链表 的 表 长 





5， 取 值 


RE 
用 e 返 回 L 中 第 i 个 数据 元 素 的 值 。 F 次- 
NO 


算法 3.7 求 单 向 链表 某 元 素 的 值 





6. 求 位 序 


返回 L 中 第 1 个 与 e 满足 关系 的 数据 元 素 的 位 序 。 若 这 样 的 数据 元 素 不 存在 ， 则 返回 0。 
算法 3.8 求 单 向 链表 某 元 素 的 位 序 








7， 单 向 链表 的 插入 


在 工 中 第 i 个 位 置 之 前 插入 新 的 数据 元 素 e，L 的 长 度 加 1。 
算法 3.9 单 向 链表 的 插入 


8， 单 向 链表 的 删除 


删除 工 的 第 i 个 数据 元 素 ， 并 用 e 返回 其 值 ，L 的 长 度 减 1。 
算法 3.10 单 向 链表 的 删除 
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9， 单 向 链表 的 遍历 


依次 将 L 的 每 个 数据 元 素 输出 。 
算法 3.11 单 向 链表 的 遍历 


10. 头 1 
随机 产生 n 个 元 素 的 值 ， 建 立 带 表 头 结 点 的 单 向 链表 L( 头 插 法 )。 
算法 3.12 单 向 链表 的 头 插 法 
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11. 尾 插 法 


随机 产生 mn 个 元 素 的 值 ， 建 立 带 表 头 结 点 的 单 向 链表 L( 尾 插 法 )。 
算法 3.13 单 向 链表 的 尾 插 法 


void CreateListTail(LinkList *L, int n) 
{ 
LinkList p,r; 
dnt dy 
srand(time(0)); 
*L = (LinkList)malloc(sizeof(Node)); 
Te 
for (i=0; i<n; i++) 
{ 
P = (Node *)malloc(sizeof(Node)); 
p->data = rand(0%100+17 
r->next=p; 
r= Pp; 
} 
r->next = NULL; 


3.4 循环 链表 





循环 链表 是 另 一 种 形式 的 链 式 存储 结构 。 它 的 特点 是 表 中 最 后 一 个 结 点 的 指 回扣 % 回 
针 域 指向 头 结 点 ， 整 个 链表 形成 一 个 环 。 由 此 ， 从 表 虽 任何 一 结 点 出 发 均 可 找到 0 | 
表 中 其 他 结 点 。 图 3.7 所 示 为 单 链 的 循环 链表 ， 类似 地 ， 还 有 多 重 链 的 循环 链表 。 六 Ee 


| EE ,FT 【参考 图 文 】 


(a) 非 空 (b) 完 表 
图 3.7 单 链 的 循环 链表 
循环 链表 的 操作 和 线性 链表 基本 一 致 ,差别 仅 在 于 算法 中 的 循环 条 件 不 是 p 或 p->next 
是 否 为 宅 ， 而 是 在 于 它们 是 否 等 于 头 指针 。 但 有 时 候 ， 在 循环 链表 中 设立 尾 指针 而 不 设 头 
指针 ， 如 图 3.8(a) 所 示 ， 可 使 某 些 操作 简化 。 例 如 ， 将 两 个 线性 表 合 并 成 一 个 表 时 ， 仅 需 
将 一 个 表 的 表 尾 和 另 一 个 表 的 表 头 相 接 。 当 线性 表 以 图 3.8(a) 所 示 的 循环 链表 作为 存储 结 
构 时 ， 这 个 操作 仅 改变 两 个 指针 值 即 可 ， 运 算 时 间 为 O(1)。 合 并 后 的 表 如 图 3.8(b) 所 示 。 


(a) 岗 个 链表 (b) 合并 后 的 表 
图 3.8 仅 设 尾 指 针 的 循环 链表 
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3.5 双向 链表 


3.5.1 双向 链表 的 基本 概念 


对 单 向 链表 进行 改进 的 另 一 种 链 式 存储 结构 是 双向 链表 。 双 向 链表 中 每 个 结 点 除了 有 

向 后 的 指针 (next) 外 ， 还 有 一 个 指向 前 一 个 结 点 的 指针 (prior)， 这 样 形成 的 链表 中 有 两 条 不 

国 直 党 加 。 同方 向 的 链 ， 因 此 ， 从 某 一 个 结 点 均 可 向 两 个 方向 访问 。 这 样 构 成 的 链表 有 两 个 方 

Rk 各 不 同 的 链 ， 简 称 为 双向 链表 。 双 向 链表 的 结 点 结构 如 图 3.9 所 示 。 其 中 链 域 prior 
回 和 next 分 别 指向 本 结 点 的 直接 前 趋 结 点 和 直接 后 继 结 点 。 

【参考 图 文 】 prior data next 





























图 3.9 双向 链表 的 结 点 结构 
双向 链表 较 单 向 链表 虽然 要 多 占用 一 些 存 储 单元 ,W 但 对 其 插入 和 删除 操作 ， 以 及 查找 








结 点 的 前 趋 和 后 继 都 非常 方便 。 在 链表 较 长 ， 插 入 、 删 除 较 频 繁 或 需要 经 常 查找 结 点 的 前 
趋 和 后 继 的 情况 下 使 用 双向 链表 比较 合适 ,双向 链表 结构 是 一 种 对 称 结构 ， 设 指针 op 指向 
双向 链表 的 某 一 结 点 ， 则 双向 链表 的 对 称 性 可 用 下 式 来 表示 : 
p=(p->next)->prior=(p—>prior)->next 
也 就 是 结 点 *p 的 地 址 既 存 放 在 其 前 趋 结 点 *(p->prior) 的 后 继 指 针 域 中 ， 又 存放 在 它 的 


后 继 结 点 *(p->next) 的 前 趋 指针 域 中 。 

如 果 循 环 链表 的 结 点 再 采用 双向 指针 ， 就 成 为 双向 循环 链表 。 图 3.10 是 一 个 具有 空 表 
头 结 点 的 双向 循环 链表 ， 其 表 尾 结 点 的 向 右 指针 指向 空 表 头 结 点 ， 空 表 关 结 点 的 向 左 指针 
指向 表 尾 结 点 。 


图 3.10 ”双向 循环 链表 




















3.5.2 ”双向 链表 的 基本 操作 











与 单 向 链表 相 比较 ,双向 链表 只 是 增加 了 直接 前 继 的 指针 域 , 故 其 存储 结构 可 表示 为 : 


typedef struct DuLNode { 
DataType data; 





struct DuLNode *prior; 
struct DuLNode *next; 
} DuLNode, *DuLink; 
在 双向 链表 上 进行 操作 基本 上 和 单 向 链表 相同 ， 例 如 ， 查 找 结 点 也 是 要 从 头 指针 指示 
的 头 结 点 开始 ， 但 插入 和 删除 时 必须 同时 修改 两 个 方向 上 的 指针 。 





1.， 双向 链表 的 插入 


在 带头 结 点 的 双向 链表 工 中 的 结 点 *p 之 后 插入 结 点 gs， 如 图 3.11 所 示 ， 其 代码 实现 
见 算法 3.14。 





3.11 ”在 双向 链表 中 的 结 点 *p 之 后 插入 结 点 *s“ \ 
算法 3.14 ”双向 链表 插入 结 点 NN 


void ListInsert DuL(DuLink &L, DuLNode* ,5 ode* s ) 


{ 
s->prior = p; NE P 赋值 给 s 的 前 趋 
s->next = p->next; / /@ 把 p->next 赋值 给 s 的 后 继 
p->next->prior = s; SS // 回 把 s 赋值 给 p->next 的 前 趋 
ww RY 


p->next = s; x ns 
} 人 Xe 


其 中 ， 步 最 @ 和 人 @ 可 前 后 互 换 ， 但 步骤 @ 不 能 先 扰 行 ; 香 则 会 使 得 p->next 提 前 变 成 了 s， 
使 得 插入 工作 无 法 完成 : 我 们 可 以 理解 为 ， 先 搞定 s 的 前 趋 和 后 继 ， 再 搞定 后 结 点 的 前 趋 ， 
最 后 解决 前 结 点 的 后 继 。 2 

2， 双 向 链表 的 出 除 

在 带头 结 点 的 双向 链表 工 中 删除 结 点 tp， 并 以 。 返回 它 的 数据 元 素 ， 如 图 3.12 所 示 ， 
其 代码 实现 见 算法 3.15。 











图 3.12 ”双向 链表 中 删除 结 点 'p 
算法 3.15 ”双向 链表 删除 结 点 


void ListDelete DuL(DuLink &L, DuNode* p, DataType &e) 
p-> prior ->next = p->next; 
Pp->next->prior = p-> prior; 
e = p->data; 
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3.6 应 用 实践 


3.6.1 单 向 链表 排序 问题 


设 有 一 个 正 整数 序列 组 成 的 有 序 单 向 链表 ( 按 递 增 次 序 有 序 ， 且 允许 有 相等 的 整数 存 
在 )， 试 编写 能 实现 下 列 功能 的 算法 (要 求 用 最 少 的 时 间 和 最 小 的 空间 ): 

(1) 确定 在 序列 中 比 正 整 数 x 大 的 数 有 几 个 (相同 的 数 只 计算 一 次 ， 如 序列 
{20,20,17,16,15,15,11,10,8,7,7,5,4} 中 比 10 大 的 数 有 5 个 )。 _ 

(2) 在 单 向 链表 将 比 正 整数 x 小 的 数 按 递减 次 序 排列 。 人 

G) 将 比 正 整数 x 大 的 偶数 从 单 向 链表 中 删除 。 Cc<K 

解 : 在 由 正 整 数 序列 组 成 的 有 序 单 向 链表 中 ， sion, 允许 相等 整数 存在 。 确 
定 比 正 整数 x 大 的 数 有 几 个 属于 计数 问题 ， th ， 要 求 记 住 前 趋 ， 前 趋 和 后 继 
值 不 同时 移动 前 趋 指针 ， 进 行 计数 。 将 比 正 整 x 按 递减 排序 ， 属于 单 向 链表 的 逆 
置 问题 。 将 比 正 整数 x ee ee herr ele 必须 记 住 
其 前 趋 ， 以 使 链表 不 断 链 。 算 法 结束 时 ; 链 ey 小 于 x 的 数 按 递 减 排列 ， 
接着 是 x( 若 有 的 话 )， 最 后 是 大 于 xf 的 次 地 







ktts 
x=p->data; // 下 面 仍 用 x 表示 数据 域 的 值 ， 计 数 
Lf(X % 2==0) // 删 偶数 
{ 
while (p->data==x) 
n 
u=p; 
p=p->next; 
free(u); 
‘ 
pre->next=p; // 拉 上 链 
} 
else // 处 理 奇数 
while (p->data==x) // 相 同 数 只 计 一 次 
{ 
pre->next=p; 
pre=p; 
p=p->next; 
} //while(p) 


Printf(" 比 值 sd 大 的 数 有 sd 个 \n"，x，k); 

} 
算法 讨论 : p 为 工作 指针 ; ,q 指向 最 小 值 元 素 ， 其 可 能 的 后 继 将 是 大 于 等 于 x 的 第 一 
村 四 “要 求 用 最 少 的 时 间 和 最 小 的 空间 ”s 本 算法 中 “最 少 的 时 间 ” 体 现在 链表 指 

， 最 I 体现 在 仅 利 用 了 几 个 变量 在 查 比 x 大 的 数 时 ， 必 须 找到 第 一 个 比 x 
4( 因 等 于 x 的 数 可 能 有 ， 人 也 可 能 多 个 ， 也 可 能 没有 )。 在 此 之 后 ， 统 计 比 正 
整数 x 大 的 数 有 几 不 ， 相同 数 只 算 一 个 ， 同 时 对 偶数 进行 删除 操作 。 
3.6.2 ”自动 预订 飞机 票 问题 









设 民航 公司 有 一 个 自动 预订 飞机 票 的 系统 ， 该 系统 中 有 一 张 用 双向 链表 表示 的 乘客 
表 ， 乘 客 表 中 的 结 点 按 乘 客 姓 氏 的 字母 顺序 相连 。 例 如 ， 表 3-1 是 某 个 时 刻 的 乘客 表 。 试 
为 该 系统 写 出 一 个 当 任 一 乘客 要 订 票 时 修改 乘客 表 的 算法 。 


表 3-1 乘客 表 
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解 : 本 题 所 用 数据 结构 是 静态 双向 链表 ， 其 结构 定义 如 下 : 


设 av 是 可 用 数组 空间 的 最 小 下 标 ， 当 有 客户 要 订 票 时 ， 将 其 姓名 写 入 该 单元 的 data 
域 ， 然 后 在 静态 链表 中 查找 其 插入 位 置 。 将 该 乘客 姓名 与 链表 中 第 一 个 乘客 姓名 比较 ， 根 
据 大 于 或 小 于 第 一 个 乘客 姓名 而 决定 沿 第 一 个 乘客 的 右 链 或 左 链 去 继续 查找 ， 直 到 找到 合 
适 位 置 将 其 插入 。 





C)》 第 3 章 线 性 表 


算法 讨论 : 本 算法 只 讨论 了 乘客 订 票 情况 ， 未 考虑 乘客 退票 ， 也 未 考虑 从 空 开 始 建 
立 链表 , 增加 乘客 时 也 未 考虑 姓名 相同 者 (实际 系统 中 姓名 不 能 作为 主 关键 字 )。 完 整 系统 
应 有 : 四 初始 化 ， 即 把 整个 数组 空间 初始 化 成 双向 静态 链表 ， 全 部 空间 均 是 可 利用 空间 ; 
加 申请 空间 ， 即 当 有 乘客 购 票 时 ， 要 申请 空间 ， 直 到 无 空间 可 用 为 止 ，@@ 释 放空 间 ， 即 当 
乘客 退票 时 ， 将 其 空间 收回 。 由 于 空间 使 用 无 优先 级 ， 故 可 将 退票 释放 的 空间 作为 下 一 个 
可 利用 空间 ， 链 入 可 利用 空间 表 中 。 


3.6.3 ”约瑟夫 (Joseph) 环 问题 


编号 为 1，2，…，n 的 n 个 人 按 顺 时 针 方向 围 坐 一 图， 每 人 持 有 一 个 密码 ( 正 整数 )。 
一 开始 任 选 一 个 正 整 数 作为 报 数 上 限 值 m， 从 第 一 个 人 开始 按 顺 时 针 方向 自 1 开始 顺序 报 
数 ， 报 到 m 时 停止 报 数 。 报 m 的 人 出 列 ， 将 他 的 密码 作为 新 的 m 值 ， 从 他 在 顺 时 针 方向 
上 的 下 一 个 人 开始 重新 从 1 报 数 ， 如 此 下 去 ， 直 至 所 有 人 全 部 出 列 为止 ， 试 设计 一 个 程序 
求 出 出 列 顺序 。 全 
解 ， 先 由 用 户 指定 总 人 数 n， 再 创建 一 个 循环 链表 并 读 入 个 人 密码 存放 在 key 中 。 
滞 | 





再 开始 模拟 报 数 ， 直 到 全 部 出 列 。 WN 


Ni 
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O re 


free(q); 
q= p->next; 
if(p!= q) 
i=0; 
else 
break; 
else 
这 





// 和 否则 ， 指 针 后 移 


p=p->next; 
gq=q->next; 
} p 
} / KN 
< 1\ 
Printf("s3d------ sd\n",n,p->elem); .XN 
} A 
本 章 小 结 


这 一 章 介 绍 了 线性 表 的 抽象 数据 类 型 的 定义 ， 以 及 它 的 两 种 存储 结构 的 实现 。 
线性 表 是 n(n 三 0) 个 数据 元 素 的 序列 ， 通 常 写 成 

(35 a2，…， airb ai an) 
因此 ， 线 性 表 中 除 第 一 个 元 素 和 最 后 一 个 元 素 外 都 具有 一 个 前 趋 和 一 个 后 继 。 线 性 表 
中 每 个 元 素 都 有 自己 确定 的 位 置 ， 即 “位 序 ”。 
n=0 时 的 线性 表 称 为 “ 空 表 ”， 它 是 线性 表 的 一 种 特殊 状态 。 因 此 ， 在 写 线性 表 的 操作 
算法 时 一 定 要 考虑 算法 对 空 表 的 情况 是 否 正确 。 
顺序 表 是 线性 表 的 顺序 存储 结构 的 一 种 别称 。 它 的 特点 是 以 “存储 位 置 相 邻 ”表示 两 
个 元 素 之 间 的 前 趋 与 后 继 关 系 。 因 此 ， 顺 序 表 的 优点 是 可 以 随机 存 取 表 中 任意 一 个 元 素 ， 
其 缺点 是 每 作 一 次 插入 或 删除 操作 时 ， 平 均 来 说 必须 移动 表 中 一 半 元 素 。 顺 序 表 主 要 应 
于 查询 而 很 少 作 插入 和 删除 操作 、 表 长 变化 不 大 的 线性 表 。 
链表 是 线性 表 的 链 式 存储 结构 的 别称 。 它 的 特点 是 以 “指针 ”指示 后 继 元 素 ， 因 此 线 
性 表 的 元 素 可 以 存储 在 存储 器 中 任意 一 组 存储 单元 中 。 它 的 优点 是 便于 进行 插入 、 删 除 操 
作 ， 但 不 能 进行 随机 存 取 ， 每 个 元 素 的 存储 位 置 都 存放 在 其 前 趋 元 素 的 指针 域 中 ， 为 取得 
表 中 任意 一 个 数据 元 素 都 必须 从 第 一 个 数据 元 素 开 始 查询 。 由 于 它 是 一 种 动态 分 配 的 结构 ， 
结 点 的 存储 空间 可 以 随 用 随 取 , 并 在 删除 结 点 时 随时 释放 , 以 便 系统 资源 更 有 效 地 被 利用 。 
这 对 编制 大 型 软件 非常 重要 ， 作 为 一 个 程序 员 ， 在 编制 程序 时 必须 养 成 这 种 习惯 。 
由 于 线性 表 是 一 种 应 用 很 广 的 数据 结构 ， 链 表 的 操作 又 很 灵活 ， 因 此 在 C++ 等 面向 对 
象 的 程序 设计 语言 中 都 已 为 程序 员 提 供 了 链表 类 ， 读 者 在 使 用 时 应 该 首先 充分 了 解 它 的 操 
作 接 口 。 在 自己 实现 链表 类 时 ， 正 如 文中 所 述 ， 应 该 为 链表 结构 设置 合适 的 数据 成 员 和 合 
适 的 操作 接口 ， 以 使 每 个 基本 操作 的 时 间 复 杂 度 在 尽 可 能 低 的 级 别 上 。 
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一 全 
习题 与 思考 
3.1 单 选 题 





下 面 关于 线性 表 的 叙述 中 ， 错 误 的 是 (。”)。 

A. 线性 表 采 用 顺序 存储 ， 必 须 占 用 一 片 连续 的 存储 单元 
B. 线性 表 采 用 顺序 存储 ， 便 于 进行 插入 和 删除 操作 
C 
D 

















.线性 表 采 用 链接 存储 ， 不 必 占 用 一 片 连续 的 存储 单元 
.线性 表 采 用 链接 存储 ， 便 于 插入 和 删除 操作 

2. 链表 不 具有 的 特点 是 ( 。 )。 
A， 插 入、 删除 不 需要 移动 元 素 B， 可 随机 访问 任 一 元 素 











C. 不 必 事 先 估计 存储 空间 D. 所 需 空间 与 线性 长 度 成 正比 
3. 非 空 的 循环 单 向 链表 head( 头 指针 ) 的 尾 结 点 p( 尾 指针 ) 满 足 ( 。”)。 
A. p->next=head B. p->next=NULL 
C. p=NULL D. p= head 
4， 对 于 一 个 头 指针 为 head 的 带头 结 点 的 单 向 链表 ， 判 定 该 表 为 空 表 的 条 件 是 (  )。 
A. head==NULL , “| B. head->next 一 NULL 
C. head->next==head Ns _, D. head!=NULL 


5， 完 成 在 双向 循环 链表 结 点 P 之 后 插入 s 的 操作 是 (-。 )。 
A. p->next=s ; s->prior=p; p->next->prior=s ; s->next=p->next; 
B. p->next->prior=s; p->next=s; s->prior=p; s->next=p->next; 
C. s->prior=p; s->next=p->next; p->next=s; p->next->prior=s ; 
D. s->priorsp;s->next=p->next; p>next->prior=s ; p->next=s; 
3.2 填空 题 、 
1. 线性 表 上 =(a1，a2，…，an) 用 数组 表示 ， 假 定 删除 表 中 任 一 元 素 的 概率 相同 ， 则 籼 
除 一 个 元 素平 均 需 要 移动 元 素 的 个 数 是 __。 
2， 对 于 一 个 具有 n 个 结 点 的 单 向 链表 ， 在 已 知 的 结 点 *p 后 插入 一 个 新 结 点 的 时 间 复 
杂 度 为 ,在 给 定 值 为 x 的 结 点 后 插入 一 个 新 结 点 的 时 间 复 杂 度 为 _。 
3. 已 知 指针 p 指向 单 向 链表 工 中 的 某 结 点 ， 则 删除 其 后 继 结 点 的 语句 是 
4. 带头 结 点 的 双 循环 链表 工 为 空 表 的 条 件 是 。 
5， 以 下 程序 的 功能 是 实现 带 附 加 头 结 点 的 单 向 链表 数据 结 点 逆序 连接 ， 请 填空 。 


void reverse(LinkList h) 
{ 





LinkList p,q; 
p=h->next; 
h->next=NULL; 
while( (1) ) 
{q=p; p=p->next; q->next=h->next; h->next= (2) ; } 


3.3 思考 题 

1. 线性 表 的 顺序 存储 结构 具有 3 个 弱点 : 在 作 插入 或 删除 操作 时 需 移动 大 量 元 素 ; 
@@ 由 于 难以 估计 ， 必 须 预先 分 配 较 大 的 空间 ， 往 往 使 存储 空间 不 能 得 到 充分 利用 ，@ 表 的 
容量 难以 扩充 。 线 性 表 的 链 式 存储 结构 是 否 一 定 都 能 够 克服 上 述 3 个 弱点 ? 试 讨论 。 

2. 若 较 频繁 地 对 一 个 线性 表 进 行 插入 和 删除 操作 ， 该 线性 表 宜 采用 何 种 存储 结构 ?为 























什么 





? 
3. 试 比较 顺序 表 与 链表 的 优 缺 点 。 
4， 试 分 析 单 向 链表 与 双向 链表 的 优 缺点 。 
5.， 写 出 在 单 循环 链表 中 的 p 所 指 结 点 之 后 插入 一 个 s 所 指 结 点 的 操作 。 
6， 写 出 在 循环 双 链表 中 的 p 所 指 结 点 之 后 插入 一 个 s 所 指 结 点 的 操作 。 
7. 试 在 链表 中 的 p 所 指 结 点 之 前 插入 一 个 s 所 指 结 点 的 操作 。 
8 试 利用 链表 来 表示 一 元 多 项 式 :A(x) = 4x0 +9x*+ 11x? 8X+7。 
9. 有 一 个 单 向 链表 L( 至 少 有 一 个 结 点 ),， 其 结 点 指针 为 head, 编写 一 个 函数 将 工 逆 置 ， 
即 最 后 一 个 结 点 变 成 第 一 个 结 点 ， 原 来 倒数 第 二 个 结 点 变 成 第 二 个 个 结 点 ， 等 等 。 

10， 有 两 个 循环 链表 ， 链 表 头 指针 分 别 为 headl， 和 head2， 编写 一 个 函数 将 链表 head1 
链接 到 链表 head2 之 后 ， 要 求 链接 后 的 链表 仍 保持 循环 链表 形式 。 

11. 已 知 由 一 个 线性 表 表 示 的 结构 中 含有 3 类 字符 的 数据 元 素 ( 包 括 字 母 字符 、 数 字 字 
符 和 其 他 字符 )， 试 编写 算法 将 该 线性 链表 分 前 为 3 个 循环 链表 ， 其 中 每 个 循环 链表 所 表示 
I 含有 一 类 字符 。 AN\》、 

， 以 循环 链表 作为 稀 夏 多 项 式 的 存储 结 告 构 ， 编写 冰凌 导 孙 数 的 各 法 ， 要 求 利用 多 项 
本 点 空间 疮 放 其 时 二 鞠 同时 释放 所 有 无 用 的 29 
p \ \ 
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梭 与 队列 


(1) 掌握 栈 和 队列 这 两 种 抽象 数据 类 型 的 定义 。 
(2) 熟练 掌握 循环 队列 和 链 队列 的 基本 操作 实现 算法 。 
(3) 理解 递归 算法 执行 过 程 中 栈 的 状态 变化 过 程 。 


知识 千 稳 图 
FE 开罗 定义 ] 
江山 和 











进 栈 操作 













循环 队列 














栈 和 队列 是 在 程序 设计 中 广泛 使 用 的 两 种 线性 数据 结构 。 因 此 ， 本 章 的 学 习 重点 在 于 
掌握 这 两 种 结构 的 特点 ， 以 便 能 在 应 用 问题 中 正确 使 用 。 


从 数据 结构 方面 看 ， 栈 和 队列 与 一 般 线性 表 是 相同 的 ， 其 特殊 性 在 于 栈 和 队列 的 基本 操作 
是 线性 表 操 作 的 子 集 ， 是 受 限制 的 线性 表 。 但 从 数据 类 型 角度 来 看 ， 它 们 是 和 线性 表 大 不 相同 
的 两 类 重要 的 抽象 数据 类 型 。 在 本 章 中 主要 学 习 如 何在 求解 应 用 问题 中 适当 地 应 用 栈 和 队列 。 
栈 和 队列 在 两 种 存储 结构 中 的 实现 都 不 难 ， 但 应 该 对 它们 了 解 并 掌握 ， 特 别 要 注意 它们 的 基本 
操作 实现 时 的 一 些 特殊 情况 ， 如 栈 满 和 栈 空 、 队 满 和 队 空 的 条 件 ， 以 及 它们 的 描述 方法 。 


第 4 章 栈 与 队列 


4.1.1 栈 的 定义 


堆栈 (stack) 简 称 为 栈 ， 是 限定 仅 在 表 一 端 进 行 插入 和 删除 操作 的 线性 表 。 通 常 将 进行 
插入 和 删除 的 一 端 ( 表 尾 ) 叫 作 栈 项 (top)， 不 允许 插入 和 删除 的 另 一 端 ( 表 头 ) 叫 作 栈 底 


(bottom)， 不 含 任何 元 素 的 栈 叫 作 空 栈 。 回扣 澡 回 
插入 数据 元 素 的 操作 叫 作 进 栈 ， 也 称 压 栈 、 入 栈 。 删 除数 据 元 素 的 操作 叫 作 2 


出 栈 ， 也 称 为 退 栈 。 由 于 堆栈 元 素 的 插入 和 删除 只 是 在 栈 项 进行 的 ， 总 是 后 进去 ” 回 

的 元 素 先 出 来 ， 所 以 堆栈 又 称 为 后 进 先 出 线性 表 或 LIFO(Last In First.Out) 表 。 堆栈 【参考 图 文 】 
ee 舌 中 也 经 常见 到 ， 如 将 子弹 装 入 弹 夹 式 的 手枪 ， 弹 夹 的 一 端 是 封闭 的 ,子弹 的 放 入 和 
出 都 是 从 弹 夹 的 一 端 进行 的 ， 那 它 就 是 一 个 堆栈 。 

理解 栈 的 定义 : 意 : 它 是 一 个 线性 表 ， 也 就 是 说 ， 拷 元 素 具 有 线性 关系 ， 即 前 趋 
后 继 关系 。 只 不 过 它 是 一 种 特殊 的 线性 表 ;， 定义 中 所 说 的 在 线性 表 的 表 尾 进行 插入 和 删除 
操作 ， 这 里 表 尾 是 本 页 ， 而 不 是 栈 底 。 我 们 可 以 用 图 4.1 来 形象 地 说 明 。 

















出 栈 





图 4.1 进出 栈 示意 图 
栈 的 抽象 数据 类 型 定义 如 下 ， 


ADT List { 
数据 对 象 : D ={ ai | ai EElemType, i=0,1,2,...,n-l, n>=0 } 
数据 关系 : R 一 { <ai-l vai >1ai-l ,aiED, i=l,...,n-l } 




















基本 操作 : 
InitStack(*S) // 初 始 化 栈 : 构造 一 个 空 栈 S 
ClearStack(*S) // 置 空 栈 : 把 s 置 为 空 栈 
StackLength(S) // 求 栈 的 长 度 : 返回 栈 s 中 的 元 素 个 数 
StackEmpty (S) // 判 断 栈 是 否 为 空 : 若 栈 s 为 空 ， 则 返回 真 ， 否 则 返回 假 
Push (*S，e) // 进 栈 : 将 插入 元 素 e 作为 新 的 栈 项 元 素 
Pop(*S, *e) // 出 栈 : 若 栈 不 空 ， 则 删除 s 的 栈 项 元 素 ， 用 e 返回 其 值 
GetTop(S, *e) // 取 栈 顶 元 素 : 返回 当前 的 栈 项 元 素 ， 并 将 其 赋值 给 e 


DispStack(SqStack S) // 显 示 元 素 : 从 栈 底 到 栈 项 依次 显示 栈 中 每 个 元 素 


} ADT List 


$f 
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栈 有 两 种 存储 方式 : 顺序 存储 (顺序 栈 ) 和 链 式 存储 ( 链 栈 )。 下 面 我 们 分 别 介绍 这 两 种 存 


储 方式 。 
加 和 4.1.2， 栈 的 顺序 存储 














栈 的 顺序 存储 也 称 顺序 栈 ， 类 似 于 顺序 表 ， 维 数组 来 存放 栈 中 元 素 
【参考 图 文 】 (图 4.2)， 栈 底 一 般 固定 设 在 下 标 为 0 的 一 端 ， 个 变量 top 指示 当前 栈 顶 元 












































素 所 在 单元 的 位 置 。 





中 








top .0 


top 
(a) 有 一 个 元 素 (b) 栈 空 (0) 栈 满 
图 4.2 栈 的 顺序 存储 示意 


通常 情况 我 们 把 空 栈 的 判定 条 件 定位 为 1t6p 二 1， 当 栈 中 有 一 个 元 素 时 top=0， 





而 栈 满 


时 top=MAXSIZE-1， 栈 的 长 度 等 于 tep+T， 如 图 4.2 所 示 。 其 进出 栈 的 实现 见 算法 4.1 和 


算法 4.2。 
栈 的 顺序 存储 的 结构 定义 : 
typedef int Status; 
typedef structt{ 
Status data[MAXSIZE]; 


int top; // 用 于 栈 项 指针 
}Sqstack; 


1. 初始 化 栈 


建立 一 个 新 的 空 栈 S， 实 际 上 是 将 栈 顶 指针 指向 -1 即 可 。 
算法 4.1 栈 的 顺序 存储 的 初始 化 操作 
int InitStack(SqStack *S) 
{ 
S->top = -1; 
return OK; 
} 
2， 把 栈 置 室 


清空 栈 中 的 元 素 ， 此 时 栈 项 指针 指向 -1。 
算法 4.2 ” 栈 的 顺序 存储 的 置 空 操作 





int ClLearStack(SqStack *S) 
{ 
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3， 判断 栈 是 否 为 空 


判断 栈 是 否 为 空 。 若 栈 S 为 空 栈 ， 则 返回 TRUE， 和 否则 返回 FALSE。 
算法 4.3 ” 栈 的 顺序 存储 的 判 空 操作 





4， 求 栈 的 长 度 AN | 


返回 s 的 元 素 个 数 ， 即 栈 的 长 度 。 Re 六 六 
算法 4.4 栈 的 顺序 存储 求 本 的 长 度 操作 









5 运 四 术 顶 元素 、 人、 + SS 


若 栈 不 空 ， 则 乃 返回 $ 的 本 项 元 素 并 这 加 可 OK， 否 则 返回 ERROR。 
算法 4.5、 栈 的 顺序 存储 返回 栈 项 元 


6 显示 元 素 


从 栈 底 到 栈 顶 依次 显示 栈 中 每 个 元 素 。 
算法 4.6 栈 的 顺序 存储 显示 栈 元 素 操作 
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7， 入 栈 操作 


栈 的 插入 ， 即 入 栈 操作 。 其 算法 执行 步骤 描述 如 下 。 

(0) 判断 栈 是 否 已 满 。 

(2) 如 果 栈 没 满 ， 则 让 栈 项 指针 上 移 。 

G) 数据 元 素 入 栈 。 

入 栈 操作 其 实 就 是 做 了 如 图 4.1 和 图 4.2 所 示 的 处 理 。 et push, 插入 元 素 e 
为 新 的 栈 项 元 素 ， 其 实现 源 程序 见 算法 4.7。 XK 

算法 4.7 栈 的 顺序 存储 的 入 栈 操作 A 





38， 出 栈 操作 2 入 ) 2 NS 

出 栈 操作 算法 的 执行 步骤 描述 如 下 。 KK 

中 济 为 空 。 

(2) 如 果 栈 不 为 室 ， 则 取出 栈 项 元 素 值 。 

(3) 栈 项 指针 下 移 。 

对 寺 出 栈 操作 pop， 若 栈 不 空 ， 则 删除 $ 的 栈 项 元 素 ， 用 。 返回 其 值 ， 并 返回 OK， 香 
则 返回 ERROR。 其 实现 源 程序 见 算法 4.8。 

算法 4.8” 栈 的 顺序 存储 的 出 栈 操作 





比较 栈 的 顺序 存储 的 入 栈 和 出 栈 的 过 程 ， 可 以 看 出 ， 入 栈 是 先 移 动 栈 顶 指针 而 后 插入 
元 素 ， 出 栈 是 先 取 出 原 栈 项 元 素 而 后 才 移 动 栈 项 指针 。 


@r 


©O 7 ”= 
4.1.3” 栈 的 链 式 存储 


一 维 数组 来 实现 堆栈 时 ， 数 组 的 大 小 必须 在 程序 中 事先 规定 ， 以 便 为 其 分 配 一 定 的 
存储 单元 。 这 样 ， 在 程序 执行 中 ， 如 果 数 组 的 某 些 单元 没有 被 用 到 ， 相 应 的 存储 单元 已 经 
为 其 分 配 ， 不 可 能 再 改作 他 用 。 此 外 ， 即 使 数组 规定 得 较 大 ， 也 不 可 能 避免 在 某 些 情况 下 
溢出 的 可 能 。 若 两 个 堆栈 共用 一 个 数组 ,虽然 可 以 充分 利用 数组 单元 , 但 是 对 这 两 个 堆 
栈 的 进 栈 、 出 栈 的 运算 略 有 不 同 。 

采用 栈 的 链 式 存储 ( 链 栈 ) 就 可 以 避免 这 些 缺点 。 栈 的 链 式 存储 是 只 允许 在 表 头 进行 插 
入 和 删除 操作 的 单 向 链表 。 图 4.3 就 是 一 个 栈 的 链 式 存储 示意 图 。 


四 本 栈 项 
固 醒 


Re 


图 4.3“ 栈 的 链 式 存储 示意 图 、 


栈 的 链 式 存储 的 结 结构 和 各 种 基本 操作 均 类 似 于 线性 链 家， 只 是 要 注意 它 的 插入 入 和 删除 
操作 受 限 ， 只 能 在 栈 项 进行 ， 为 了 方便 操作 ， 我 们 将 链表 的 头 部 作为 栈 项 。 下 面 给 出 栈 的 
链 式 存储 的 结构 定义 ; 


typedef WP 下 C - 


{ F 























于 

















int data; 
struct StackNode *next; 
}stackNode, *LinkSstackPtr; 


typedef struct 
[i 
LinkStackPtr top; 
int count; 
}Linkstack; 
栈 的 链 式 存储 的 操作 绝 大 部 分 都 和 单 向 链表 类 似 ， 只 是 在 插入 和 删除 上 有 一 些 特殊 。 
下 面 分 别 对 这 两 种 情况 进行 分 析 。 
1， 栈 的 链 式 存储 的 入 栈 操作 
入 栈 操作 算法 的 执行 步骤 描述 如 下 。 
(1) 分 配 一 个 结 点 。 
(2) 把 结 点 插入 链 栈 头 。 


只 
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(3) 返回 栈 顶 指针 top。 
插入 元 素 e 作为 新 的 栈 项 元 素 ， 其 实现 源 程 序 见 算法 4.9。 
算法 4.9 栈 的 链 式 存储 的 入 栈 操作 


int Push(LinkStack *S，int e) 
K 





LinkStackPtr P=(LinkStackPtr)malloc(sizeof(StackNode)); 


p->data=e; 
p->next=S->top; // 把 当前 的 栈 顶 元 素 赋值 给 新 结 点 的 直接 后 继 
S->top=s; // 将 新 的 结 点 p 赋值 给 栈 项 指针 


S->count++; 
return OK; 


} 

2， 栈 的 链 式 存储 的 出 栈 操作 

出 栈 操作 算法 的 执行 步骤 描述 如 下 。 

(1) 判断 栈 是 否 为 空 。 

(2) 如 果 栈 不 为 室 ， 则 取出 栈 顶 元 素 值 。 

(3) 栈 项 指针 下 移 ， 释 放 栈 项 结 点 。 

若 栈 不 空 ， 则 删除 S 的 栈 项 元 素 ,， 用 *e 返回 其 值 ， 并 返回 OK， 否 则 返回 ERROR。 其 
实现 源 程序 见 算法 4.10。 

算法 4.10 ” 栈 的 链 式 存储 的 出 栈 操 作 








int Pop(Linkstack *s, int *e) of 上 
{ E Ns 人 
Linkstack tr pl) 
if(stackEmpty(*s)) 
return ERROR; 
*e=S->top->data; 
p=S->top; // 将 栈 顶 结 点 赋值 给 p 
S->top=S->top->next; // 使 得 栈 项 指针 下 移 一 位 ， 指 向 后 一 结 点 
free(p); // 释 放 结 点 


S->count--—; 
return OK; 
} 


栈 的 链 式 存储 的 进 栈 push 和 出 栈 pop 操作 都 很 简单 ， 没 有 任何 循环 操作 ， 时 间 复 
杂 度 均 为 0(1)。 对比 一 下 栈 的 顺序 存储 和 和 链 式 存储 ,它们 在 时 间 复 杂 度 上 都 是 一 样 的 ， 
均 为 0(1)。 对 于 空间 复杂 度 ， 栈 的 顺序 存储 需要 事先 确定 一 个 固有 的 长 度 ， 可 能 会 
在 内 存 空间 浪费 的 问题 ， 但 它 的 优势 是 存 取 时 定位 很 方便 ， 而 栈 的 链 式 存储 则 要 求 每 
个 元 素 都 有 指针 域 ， 这 同时 也 增加 了 一 些 内 存 开销 ， 但 对 栈 的 长 度 无 限制 。 所 以 它们 
的 区 别 和 线性 表 中 讨论 的 一 样 ， 如 果 栈 的 使 用 过 程 中 元 素 变化 不 可 预料 ， 有 时 很 小 ， 
有 时 非常 大 ， 那 么 最 好 用 栈 的 链 式 存储 ， 而 如 果 它 的 变化 在 可 控 范 围 内 ， 使 用 栈 的 顺 
序 存储 会 更 好 一 些 。 


Eo 
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4.2 队 列 





4.2.1 队列 的 定义 


队列 (queue) 是 一 种 运算 受 限 制 的 线性 表 ， 它 与 堆栈 的 不 同 之 处 在 于 元 素 的 添加 在 表 的 
一 端 进行 ， 而 元 素 的 删除 在 另 一 端 进行 。 允 许 添 加 元 素 的 一 端 称 为 队 尾 (reaD， 人 允许 删除 元 
素 的 一 端 称 为 队 头 (front)。 不 含 元 素 的 空 表 称 为 空 队 。 向 队列 添加 元 素 称 为 入 队 ， 从 队列 
中 删除 元 素 称 为 出 队 。 由 于 新 入 队 的 元 素 只 能 添加 到 队 尾 , 出 队 的 元 素 只 能 是 队 头 的 元 素 ， 
所 以 队列 的 特点 是 先进 入 队列 的 元 素 先 出 队 ， 故 队列 也 称 为 先进 先 出 表 或 FIFO(First Im 
First Out) 表 。 。 

在 日 常生 活 中 有 很 多 这 样 的 例子 ， 如 接 打 移动 、 联 通 、 电信 等 客服 电话 ， 客服 人 员 与 
客户 相 比 总 是 少数 ， 在 所 有 的 客服 人 员 都 占线 的 情况 下 ， 客 户 会 被 要 求 等 待 ， 直 到 有 某 个 
客服 人 员 空 下 来 才能 为 最 先 等 待 的 客户 接 通 电话 。 这 里 就 是 将 所 有 当前 拨打 客服 电话 的 客 
户 进行 了 排队 处 理 。 假 设 队 列 q = (a1,a2,…,an)， 那么 :a 是 队 头 元 素 ， an 是 队 尾 元 素 。 这样 我 
们 就 可 以 在 删除 时 ， 总 是 从 a 开始， 而 插入 时 , “总 是 从 队 尾 开始 ， 如 4.4 图 所 示 。 


Ja] ~ [|] 入 队列 


图 4.4 队列 























与 堆栈 类 似 ， 队 列 最 简单 的 表示 方法 是 采用 一 维 数组 ， 如 图 4.5 所 示 。 设 数组 为 data， 
其 下 标 下 界 为 0, 上 界 为 MAXSIZE-1。 用 整 型 变量 rear 指示 队 尾 的 下 标 值 , 称 为 队 尾 指针 ， 
目 整 型 变量 front 指示 队 头 的 下 标 值 ， 称 为 队 头 指针 。 














MAXSIZE-1 


0 1 2 3 4 5 oe 
= EL -| | -|r| | | 
front rear 


4.5 一 维 数组 队列 


假定 有 a~f 共 6 个 元 素 先后 进入 队列 后 ，a、b 两 个 元 素 又 陆续 出 队 ， 则 图 4.5 中 的 队 
尾 指针 rear = 5， 而 队 头 指针 front = 2。 

队列 的 抽象 数据 类 型 定义 如 下 : 

ADT List { 


数据 对 象 : D ={ ai | ai EElemType, i=1,2,...,n, n>=0 } 
数据 关系 : R 二 { <ai-l vai >1ai-l vaiED，i=2, .on } 


基本 操作 : 
InitQueue (&Q) // 初 始 化 空 队列 Q 
ClearQueue (&0) // 释 放 栈 9 占用 的 存储 空间 
QueueEmpty (9) // 判 断 队 列 是 否 为 空 


只 
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C 
QueueLength(SqQueue 0) // 返 回 队列 的 长 度 
GetHead(SqQueue 0,OElemType *e) // 用 e 返回 0 的 队 头 元 素 
InQueue(&Q, e) // 将 元 素 e 入 队 作为 队 尾 元 素 
OutQueue(&0, e) 7// 从 队列 2 中 出 队 一 个 元 素 , 并 将 其 赋值 给 e 
QueueTraverse(SqQueue 0) // 从 队 头 到 队 尾 依次 将 队列 @ 中 每 个 元 素 输出 
} ADT List 


队列 也 有 两 种 存储 方式 : 顺序 存储 (顺序 队列 ) 和 链 式 存储 ( 链 队列 )。 下 面 我 们 分 别 介绍 


这 两 种 存储 方式 。 
4.2.2 ”队列 的 顺序 存储 
1. 顺序 队列 





顺序 存储 的 队列 称 为 顺序 队列 。 顺序 队列 类 似 于 顺序 栈 ， 用 一 维 数 组 米 存 放 列 元 素 。 


但 队 头 和 队 尾 都 是 活动 的 ， 
如 果 队 列 中 元 素 的 数目 





因此 设 两 个 指针 : 队 头 指针 和 队 尾 指针 。 
等 于 0， 则 称 其 为 空 队列 于 并 规定 此 时 队 头 指 针 和 队 尾 指针 均 


为 0， 即 front =rear= 0。 每 当 插入 新 的 队列 尾 元 素 时 *“ 尾 指针 增 1”;， 每 当 删 除 队列 头 元 
素 时 ,“ 头 指针 增 1”。 因 此 ， 在 非 空 队列 中 我们 指定 队 头 指针 指向 队 头 元 素 在 队列 中 的 
实际 位 置 ， 队 尾 指针 指向 队 尾 元 素 在 队列 实际 位 置 的 后 一 个 位 置 ， 如 图 4.6 所 示 。 








| 


CE 


| 


front=rear=0 


(a) 空 队 


顺序 队列 的 存储 结构 定 


typedef struct 








front=0 rear=3 front=6 rear=9 front=6 rear=10 
(b) 有 3 个 元 类 “(6) 一 般 情况 (d)“ 候 上 溢 ” 现 象 
图 4.6 ”队列 操作 示意 图 


义 如 下 : 


{ int data [MAXSIZE]; 


Tn On 
int rear; 
}SsqQueue; 


// 头 指针 
// 尾 指针 ， 若 队列 不 空 ， 指 向 队 尾 元 素 的 下 一 个 位 置 


队列 基本 操作 的 具体 实现 见 算法 4.11 一 算法 4.18。 
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1) 初始 化 顺序 队列 
初始 化 一 个 空 队列 Q。 
算法 4.11 顺序 队列 的 初始 化 





2) 清空 顺序 队列 
释放 队列 Q 占用 的 存储 空间 。 
算法 4.12 顺序 队列 的 清空 








SS 
3) 判断 顺序 队列 是 否 为 空 AN 


若 队列 Q 为 空 队列 ， 则 返回 Thyey KW 
算法 4.13 ”顺序 队列 的 判 空 






FALSE。 








4) 求 顺 序 队列 的 长 度 
返回 Q 的 元 素 个 数 ， 即 队列 的 当前 长 度 。 
算法 4.14 顺序 队列 的 长 度 


5) 返回 顺序 队列 的 首 元 素 
若 队列 不 空 ， 则 用 e 返回 Q 的 队 头 元 素 ， 并 返回 OK， 否 则 返回 ERROR 。 
算法 4.15 ”返回 顺序 队列 的 首 元 素 


只 
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6) 顺序 队列 的 入 队 操作 

设 用 Q 表示 一 个 队列 结构 体 变量 ， 若 已 知 待 添加 的 元 素 变量 为 x， 入 队 操作 队 尾 指针 
加 1， 指 向 新 位 置 后 元 素 入 队 。 其 代码 实现 见 算法 4.16。 

算法 4.16 顺序 队列 的 入 队 操作 





7 顺序 队列 的 出 队 操 作 VAN 
当 从 队列 删除 元 素 时 ， 队 头 指针 front 尾 指 针 rear 不 动 ， 出 队 时 ， 假 设 要 
求 将 出 队 的 元 素 值 赋 给 变量 x。 在 不 考虑 队 空 的 情况 下 ， 出 队 操作 从 头 指针 加 1， 表 明 


队 头 元 素 出 队 。 若 队列 不 空 ， NA 用 x 返回 其 值 。 其 代码 实现 见 算 
法 4.17。 


和 | 
算法 4.17 到 队列 的 内 | 广 





8) 顺序 队列 的 遍历 
从 队 头 到 队 尾 依次 输出 队列 Q 中 每 个 元 素 。 
算法 4.18 ”顺序 队列 的 元 素 显示 





@r 


GO 一 本 


Printf("sc "，Q@Q-data[i])7 

i=(i+1)%MAXSIZE; //i 指向 下 一 个 元 素 
. 
TineFO Nam) 
return OK; 


} 


[4 
< 

顺序 队列 中 的 溢出 现象 主要 包括 如 下 3 种 情况 。 

(D“ 下 溢 ” 现象 。 当 队列 为 空 时 ， 进 行 出 队 操 作 产 生 的 溢出 现象 称 为 “下 益 ” 现 象 。 
“下 溢 ” 是 正常 现象 ， 常 用 作 程序 控制 转移 的 条 件 。 

(2)“ 真 上 溢 ” 现象 。 当 队列 满 时 ， 进 行进 栈 操作 产生 空间 溢出 的 现象 称 为 “ 真 上 滋 ” 
现象 “ 真 上 溢 ” 是 一 种 出 错 状态 ， 应 设法 避免 。 RE 

(3)“ 假 上 溢 ” 现 象 ， 由 于 入 队 和 出 队 操 作 中 ， 头 尾 指针 只 增加 不 减 小 ， 致 使 被 删 元 
素 的 空间 永远 无 法 重新 利用 。 当 队列 中 实际 的 元 素 个 数 远 远 小 于 向 量 空间 的 规模 时 ， 也 
可 能 由 于 尾 指针 已 超越 向 量 空间 的 上 界 而 不 能 作 入 队 操 作 . 该 现象 称 为 “ 假 上 溢 ” 现象. 


2. 循环 队列 


顺序 队列 经 过 一 段 时 间 的 插入 和 删除 操作 ， 整 个 队列 的 rear 指针 会 不 断后 移 ， 最 后 
rear=MAXSIZE， 不 能 再 插入 数据 ;而 front 前 面 即使 由 于 队列 元 素 出 队 还 有 很 多 空间 ， 也 
是 不 能 利用 的 。 如 图 4.6(d) 所 示 ， 这 种 队列 中 尚 有 足够 的 室 间 ， 但 元 素 不 能 入 队 ， 即 顺序 
队列 的 “ 假 上 游 ” 现 象 解决 “ 假 上 溢 ” 现象 的 方法 之 一 是 将 队列 的 数据 区 看 作 头 尾 相 接 
的 循环 结构 ， 头 尾 指针 的 关系 不 变 ， 将 其 称 为 循环 队列 。 
如 图 4.7. 所 示 , 循环 队列 就 是 将 顺序 队列 最 后 一 个 位 置 连接 到 第 一 个 位 置 。 这 里 要 注 
意 ， 这 种 循环 不 是 物理 层面 上 的 实现 ， 而 是 通过 取 模 运 算 在 逻辑 上 实现 循环 ， 即 对 队 头 指 
针 和 队 尾 指针 取 队 列 最 大 容量 (MAXSIZE) 的 模 。 这 里 队 头 、 队 尾 指 针 的 指向 与 顺序 队列 中 
的 定义 一 样 。 






























图 4.7 循环 队列 
设 MAXSIZE = 10， 因 为 是 头 尾 相 接 的 循环 结构 ， 入 队 时 的 队 尾 指针 加 1 操作 修改 为 


Ee 
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Q->rear=(Q—>rear+1)%MAXSIZE 
而 出 队 时 的 队 头 指针 加 1 操作 修改 为 
Q->front=(Q->front+1)%MAXSIZE 
图 4.8 所 示 为 循环 队列 操作 示意 图 。 
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front=5 rear=9 front=5 rear=5 front=6 rear=9 front=5 rear=4 
(a) 有 4 个 龙岩 (b) 队 满 (c) 队 空 (d) 以 满 
图 冰 8、 循环 队列 操作 示意 图 ~ 


从 图 4.8 所 示 的 循环 队列 可 以 看 出 ， 图 4.8(a) 中 具有 45、ae、a7、as 共 4 个 元 素 ， 此 时 
front =5, rear = 9; 随 着 as~ars 相继 入 队 ， 队 中 具有 了 10 个 元 素 一 一 队 满 ， 此 时 front =5， 
rear = 5。 如 图 4.8(b) 所 示 ， 可 见 在 队 满 情况 十 有 .front = rear; 若 在 图 4.8(a) 情 况 下 ，as 一 as 
相继 出 队 ， 此 时 队 室 ，front= rear=9， 如 图 48(c) 所 示 ， 即 在 队 空 情况 下 也 有 front = rear。 
也 就 是 说 “ 队 满 ”与 “ 队 空 ”的 条 件 是 相同 的 。 这 显然 是 必须 要 解决 的 一 个 问题 。 

首先 ， 我 们 定义 循环 队列 的 顺序 存储 结构 如 下 : 

typedef struct 


1 
int data[MAXSIZE]; 


int front; // 头 指针 
int rear; // 尾 指针 ， 若 队列 不 室 ， 指 向 队 尾 元 素 的 下 一 个 位 置 
int flag; 

}CsqQueue; 











其 次 ， 我 们 用 两 种 方法 来 解决 “ 队 满 ”与 “ 队 空 ”不 能 区 别 的 问题 。 
) 附设 一 个 队 中 元 素 个 数 的 变量 

附设 一 个 队 中 元 素 个 数 的 变量 ， 如 flag， 当 flag = 0 时 队 空 ， 当 flag=MAXSIZE 时 队 
满 。 其 相应 的 操作 如 下 : 

(1) 若 队列 未 满 ， 则 插入 元 素 e 为 Q 新 的 队 尾 元 素 。 循 环 队列 的 入 队列 操作 代码 见 算 
法 4.19。 


Cols 
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算法 4.19 循环 队列 的 入 队 





(2) 若 队列 不 室 ， 则 删除 Q 中 队 头 元 素 ， 用 e 返回 其 值 。 循 环 队列 的 出 队列 操作 代码 
见 算法 4.20。 
算法 4.20 ”循环 队列 的 出 队 





2) 少 用 一 一 个 队 中 元 素 的 空间 和 

为 了 区 别 队 满 还 是 队 空 ， en i 把 如 
图 4.8(d) 所 示 的 情况 视 ， 2 Was 这 
种 情况 下 ， 队 满 的 条 件 是 (rear+1)%MAXSI; saa 可 以 和 空 队 区 别 开 。 

另外 ， >front 时 ， 了 的 长 罗网 Root 但 当 rear 从 后 面 赶 上 front 时 ， 即 
rear<ftont， 队 询 收 度 分 两 段 ， 一 段 是 MAXSIZE -front ， 另 一 段 是 0trear， 加 在 一 起 ， 队 
列 长 度 为 rear 二 front+ MAXSIZE)%MAXSIZE 。 有 了 这 些 分 析 ， 我 们 实现 循环 队列 的 代码 
就 不 难 了 ， 具 体 如 下 。 

(1) 初始 化 队列 。 

算法 4.21 循环 队列 的 初始 化 


(2) 求 队列 的 长 度 。 
算法 4.22 求 循环 队列 的 长 度 








= 
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return (Q.rear - Q.front + MAXSIZE)%s MAXSIZE; 
| 


(3) 入 队列 操作 。 若 队列 未 满 ， 则 插入 元 素 e 为 Q 新 的 队 尾 元 素 。 循 环 队列 的 入 队列 
周 操作 代码 见 算法 4.23。 
算法 4.23 ”循环 队列 的 入 队 





int EnQueue(SqQueue *0，int e) 
‘ 
if ((Q->rear+1)$MAXSIZE == Q->front) // 队 满 的 判断 
return ERROR; 


Q->data[Q->rear]=e; // 将 元 素 e 赋值 给 队 尾 
Q->rear=(Q->rear+1)%sMAXSIZE; //rear 指针 向 后 移 一 位 置 ， 若 到 最 后 则 转 到 数组 头 部 
return OK; : SS 

} \A< 


A 




















(4) 出 队列 操作 。 若 队列 不 室 ， 则 删除 Q 中 的 队 头 元 素 ， 用 e。 返回 其 值 。 循 环 队列 的 
出 队列 操作 代码 见 算法 4.24。 
算法 4.24 ”循环 队列 的 出 队 











\ 


int DeQueue(SqQueue *Q, int SN 
{ 


if (Q->front == a > 0 
return ERROR 
*e=Q- >data[Q->front]; /AN 
0->front=(Q->front+1)3MAXSIZE; /7front 指针 向 后 移 一 位 置 ， 若 到 最 后 则 转 到 数组 头 部 
return ok;— SET 2 
} NSN De 


4.2.3 ”队列 的 链 式 存储 


通过 前 面 的 讲解 ， 我 们 发 现 ， 若 队列 单 是 顺序 存储 ， 而 非 循环 队列 ， 算 法 的 时 间 性 能 
是 不 高 的 ， 但 循环 队列 又 面临 着 数组 可 能 会 溢出 的 问题 ， 所 以 下 面 我 们 来 探讨 一 下 不 需要 
担心 队列 长 度 的 链 式 存储 结构 。 
队列 的 链 式 存储 结构 称 为 链 队 列 。 链 队列 的 结构 和 各 种 基本 操作 均 类 似 于 线性 链表 ， 
只 是 要 注意 ， 它 的 插入 和 删除 操作 受 限 ， 只 允许 在 队 尾 插入 、 队 头 删 除 。 所 以 链 队列 其 实 
是 只 允许 尾 进 头 出 的 单 链表 。 为 了 操作 上 的 方便 ， 我 们 将 队 头 指针 指向 链 队列 的 头 结 点 ， 
而 队 尾 指针 指向 终端 结 点 ， 如 图 4.9 所 示 。 


























头 结 点 队 头 队 尾 头 结 点 

= 了 - 芋 昌 -一 全 
hr Tear 

(a) 非 空 链 队 证 (b) 空 链 队 刻 


4.9 链 队列 示意 图 
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链 队列 的 结构 定义 如 下 : 





1， 链 队列 的 入 队 a 2 
a 
一 友和 … x 


NN Di 
XK Ry 本 


国 410 链 队列 的 入 队 


设 插入 元 素 e 为 Q 的 新 网 屁 元 双 ， waa 4.25。 
算法 4.25 链 队 列 入 队 操 作 





2. 链 队 列 的 出 队 


出 队 操 作 就 是 头 结 点 的 后 继 结 点 出 队 ， 将 头 结 点 的 后 继 改 为 它 后 面 的 结 点 ， 如 图 4.11 
所 示 。 

若 链 队列 除 头 结 点 外 只 剩 一 个 元 素 时 ， 则 需 将 rear 指向 头 结 点 ， 如 图 4.11(b) 所 示 ; 若 链 
队列 不 室 ， 删 除 Q 的 队 头 元 素 ， 用 e 返回 其 值 ， 并 返回 OK， 和 否则 返回 ERROR， 如 图 4.11(a) 


所 示 。 其 相应 的 代码 实现 见 算法 4.26。 
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(a) 一 般 结 点 出 队 全 只 有 一个 缚 上 的 四 区 


图 4.11 链 队列 的 出 队 
算法 4.26 链 队 列 的 出 队 操 作 





3， 输出 元 素 YU 


从 队 头 到 队 必 依次 私人 纤 氏 daQ rom 427。 
算法 4.27 输出 链 队 的 元 素 


YE 





对 于 循环 队列 与 链 队 列 的 比较 ， 可 以 从 以 下 两 方面 来 考虑 。 

(1) 从 时 间 上 说 ， 其 实 它 们 的 基本 操作 都 是 常数 时 间 ， 即 都 是 O(1)。 不 过 循环 队列 是 
事先 申请 好 空间 ， 使 用 期 间 不 释放 ， 而 对 于 链 队列 ， 每 次 申请 和 释放 结 点 会 存在 一 些 时 间 
开销 ， 如 果 入 队 、 出 队 频繁 ， 则 两 者 还 是 有 细微 差异 的 。 

(2) 从 空间 上 来 说 ， 循 环 队列 必须 有 一 个 固定 的 长 度 ， 所 以 就 有 了 存储 元 素 个 数 和 空 


Gy 
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间 浪 费 的 问题 。 而 链 队列 不 存在 这 个 问题 ， 尽 管 它 需要 一 个 指针 域 ， 会 产生 一 些 空间 上 的 
开销 ， 但 也 可 以 接受 。 所 以 在 空间 上 ， 链 队列 更 加 灵活 。 

总 的 来 说 ， 在 可 以 确定 长 度 最 大 值 的 情况 下 ， 建 议 用 循环 队列 ， 如 果 无 法 预 估 队列 的 
长 度 ， 则 用 链 队列 。 























4.3 应 用 实践 


4.3.1 火车 车 厢 重 排 问题 


一 列 货 运 列车 共有 n 节 车 厢 ， 每 节 车 厢 将 停放 在 不 同 的 车 站 。 假 定 n 个 车 站 的 编号 分 
别 为 1~n， 即 货运 列车 按照 第 n 站 至 第 1 站 的 次 序 经 过 这 些 车 站 。- 为 了 便于 从 列车 上 撮 掉 
相应 的 车 厢 ， 车 厢 的 编号 应 与 车 站 (目的 地 ) 的 编号 相同 ， 使 各 车 厢 从 前 至 后 按 编 号 1 到 n 
的 次 序 排列 ， 这 样 ， 在 每 个 车 站 只 需 印 掉 最 后 一 节 车 厢 即 本立 所以， 给 定 任 意 次 序 的 车 厢 
后 ， 必 须 重 新 排列 它们 。 可 以 通过 转轨 站 完成 车 厢 的 重 排 工作 ， 在 转轨 站 中 有 一 个 入 轨 、 
一 个 出 轨 和 k 个 缓冲 轨 ， 缓 冲 轨 位 于 入 轨 和 出 轨 之 间 收 开始 时 ，n 节 车 厢 从 入 轨 进 入 转轨 
站 ， 转 轨 结 束 时 各 车 厢 按 照 编号 1 至 n 的 次 序 离 开 转轨 站 进入 出 轨 。 

解 : 为 了 重 排 车 厢 ， 需 从 前 至 后 依次 检查 入 轨 上 的 所 有 车 厢 。 如 果 正 在 检查 的 车 厢 就 
是 下 一 个 满足 排列 要 求 的 车 厢 ， 可 以 直接 把 它 放 到 出 轨 上 去 ， 如 果 不 是 ， 则 把 它 移动 到 组 
冲 轨 上 ， 直 到 按 输 出 次 序 要 求 轮 到 它 时 才 将 它 放 到 出 轨 上 =#- 缓 冲 轨 是 按照 LIFO 的 方式 使 
用 的 ， 因 为 车 厢 的 进 和 出 都 是 在 缓冲 轨 的 顶部 进行 的 。 在 重 排 车 厢 过 程 中 ， 仅 允许 以 下 两 
种 移动 操作 。 

(1) 车厢 可 以 从 入 轨 的 前 部 ( 即 右 端 ) 移 动 到 一 个 缓冲 轨 的 顶部 或 出 轨 的 左 端 。 

(2) 车 厢 可 以 从 一 个 缓冲 轨 的 顶部 移动 到 出 轨 的 左 端 。 

下 面 给 出 了 Railroad 中 所 使 用 的 函数 二 一 Output 和 Hold。 Output 函数 用 于 把 一 节 车 而 
从 缓冲 轨 送 至 出 轨 处 ， 它 同时 将 修改 minS( 指 向 所 有 栈 中 栈 顶 元 素 最 小 的 栈 ) 和 minH( 指 向 
该 栈 栈 顶 元 素 )。Hold 函数 根据 车 厢 分 配 规则 把 车 厢 c 送 入 某 个 缓冲 轨 ， 必 要 时 也 需要 修 
改 minS 和 minH。 






































#define Stacksize 100 // 假 定 预 分 配 的 栈 空间 最 多 为 100 个 元 素 
#define MaxLength 100 // 最 大 的 字符 串 长 度 
typedef int DataType; // 假 定 栈 元 素 的 数据 类 型 为 整数 


typedef struct 

{ 
DataType datalStackSize]; 
int tops 

}Seqstack; 


// 置 栈 空 
void Initial(SeqStack *S) 
本 

S->top=-1; 
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4.3.2 ”四 则 运算 表达 式 求 值 


表达 式 求 值 是 程序 设计 语言 编译 中 的 一 个 最 基本 问题 。 它 的 实现 是 栈 应 用 的 一 个 典型 
例子 。 要 对 表达 式 正 确 求 值 ， 首 先 要 能 够 正确 解释 表达 式 。 例 如 ， 要 对 算术 表达 式 
7+(4-2)*3+12/2 求 值 ， 首 先 要 了 解 算术 四 则 运算 的 规则 。 其 可 归纳 为 以 下 3 点 : 

(1) 先 乘除 后 加 减 。 

(2) 从 左 算 到 右 。 


@r 





其 中 





(3) 先 括号 内 ， 后 括号 外 。 
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再 根据 运算 优先 级 的 规定 来 实现 对 表达 式 的 编译 或 解释 执行 。 





任何 一 个 表达 式 都 是 由 操作 数 (operand)、 运 算 符 (operator) 和 界限 符 (delimiter) 组 成 的 。 





了 叙述 的 简洁 ， 我 们 仅 讨论 简单 算术 表达 式 的 求 值 问题 。 


法 则 ， 在 运算 的 每 一 步 
3 种 ， 即 opl 的 优先 级 低 于 op2，op1 


算 符 (+、-、*、/、(、)、 基 的 优先 关系 可 分 如 下 几 种 情况 : 


四 则 运算 表达 式 算 法 的 基本 思想 如 下 : 


Ph， 操 作 数 可 以 是 常数 ， 也 可 以 是 被 说 明 为 变量 或 常量 的 标识 符 ， 运 算 符 可 以 分 为 算术 
运算 符 、 关 系 运 算 符 和 逻辑 运算 符 3 类 ;， 基本 界限 符 有 左 、 右 括号 和 表达 式 结束 符 等 。 为 








我 们 把 运算 符 和 界限 符 统称 为 算 符 ， 它 们 构成 的 集合 命名 为 OP。 根 据 四 则 运算 基本 














Ph， 任 意 两 个 相继 出 现 的 操作 符 op1 和 op2 之 间 的 优先 关系 最 多 有 
优先 级 等 于 op2，op1 的 优先 级 高 于 op2。 具 体 地 





(1) 当 op1 为 4*、 人 "时, 优先 级 低 于 “CC、**、1/”， 而 高 于 小、 合 ?、 人 4?、 全 '。 
@) 当 op1 为“**、'/ 时 ,优先 级 低 于 “(， 而 高 于 小、 人 议和 +、 人 一、 导 、 人 1。 


(3) 当 opl 为 “” 时 ， 优 先 级 低 于 


(4) 当 opl 为 “)” 时 ， 优 先 级 高 


6? 
二 


NOC 而 等 于 )'。 
= RN A 


(5) 当 opl 为 “# 时 ， 优先 级 低 于 “+”、 熏 加、“/、“(”， 而 等 于 于 。 






注意 ，“( 与 #、 人 9 与 “( 
为 实现 运算 符 优先 算法 ， 可 以 使 有 


人 #? 与 


人 ”无 优先 关系 。 


两 个 工作 栈 : 运算 符 栈 OPTR 和 操作 数 栈 OPND。 


(1) 置 OPND 栈 为 空 栈 ， 表 达 式 起 始 符 “#” 为 OPTR- 栈 的 栈 底 元 素 。 





(2) 依次 读 入 表达 式 中 的 每 个 字符 , 若 
栈 的 栈 


算 符 比较 优先 权 后 作 相 








;是 


作 , 直 





呆 作 数 则 进 OPND 栈 , 若是 运算 符 则 和 OPTR 


整个 表达 式 求 值 完毕 ( 即 OPTR 栈 的 栈 底 元 


素 和 当前 读 入 的 字符 均 为 -# 即 为 求 值 完毕 )。 
下 面 以 表达 式 7+1(4=2)*3+12/2 的 求 值 为 例 讲解 运算 符 优先 算法 ,其 图 解 如 图 4.12 所 示 。 


top 


OPTR 9 
(a) 初始 状态 














(0) 读 取 ， 作 运算 4-2=2 
图 4.12 四则 运算 过 程 
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# 13 
OPTR OPND 
(f) 作 运算 7 




















‘wh 
5 
OPND 
:运算 12/2=6 
































Ml 





op Lp. 
OPTR OPND OPTR OPND 
(iD 作 运 算 13+6=19 (j) 出 栈 


图 4.12 . 四 则 运算 过 程 ( 续 ) 
相应 的 代码 实现 如 下 : 





int Precede(int tl,int t2) /7 判断 两 个 符号 的 优先 关系 
{ 
nt 
switch(t2) 
{ 
Case "十 
case '-':if(tl=="'('||t1l=='#') 
人 
else 
Ee 
break; 
CaSe Vv*s 
Cue VA LE Le EA Ly 
fl 
else 
Ee 


break; 
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4.3.3 渡口 管理 问题 


某 汽车 渡口 ， 过 江 渡船 每 次 能 载 10 辆 车 过 江 。 过 江 车 辆 分 为 客车 类 和 货车 类 ， 上 渡 
船 有 如 下 规定 : 同类 车 先 到 先 上 船 ; 客车 先 于 货车 上 渡船 ， 且 每 上 4 辆 客车 才 允 许 上 1 辆 
货车 ， 若 等 待 客车 不 足 4 辆 ， 则 以 货车 代替 ， 若 无 货车 等 待 允许 客车 都 上 朋 。 试 写 一 算法 


模拟 渡口 管理 。 
解 : 假设 q 数组 的 元 素 个 数 为 10， 恰 好 是 每 次 载 渡 的 最 大 量 。 设 客车 的 队列 是 ql， 


货车 的 队列 是 g2。 相 应 的 算法 如 下 : 





数据 结构 与 算法 应 用 实践 教程 第 己 版 





Sah 与 队列 
O a AN 
4.3.4 ”农夫 过 河 问题 


个 农夫 带 着 一 只 狼 、 一 只 羊 和 一 棵 白菜 ， 身 处 河 的 南岸 。 他 要 把 这 些 东西 全 部 运 到 
北岸 。 问 题 是 他 面前 只 有 一 条 小 船 ， 船 小 到 只 能 容 下 他 和 一 件 物品 ， 而 且 ， 只 有 农夫 能 撑 
船 。 另 外 ， 因 为 狼 能 吃 羊 ， 而 羊 爱 吃 白菜 ， 所 以 农夫 不 能 留 下 羊 和 白菜 或 者 狼 和 羊 单独 在 
河 的 一 边 ， 自 己 离 开 。 试 问 农 夫 该 采取 什么 方案 才能 将 所 有 的 东西 运 过 河 呢 。 

解 : 求解 这 个 问题 的 最 简单 的 方法 是 一 步 一 步 进行 试探 ， 每 一 步 都 搜索 所 有 可 能 的 选 
择 ， 对 前 一 步 进行 合适 的 选择 后 再 考虑 下 一 步 的 各 种 方案 。 用 计算 机 实现 上 述 求解 的 搜索 
过 程 可 以 采用 两 种 不 同 的 策略 : 一 种 是 广度 优先 (breadth first) 搜 索 ， 另 一 种 是 深度 优先 
(depth first) 搜 索 。 
这 里 采用 广度 优先 搜索 策略 。 广 度 优先 的 含义 是 在 搜索 过 程 中 总 是 首先 搜索 下 面 一 步 
的 所 有 可 能 状态 ， 然 后 进一步 考虑 更 后 面 的 各 种 情况 。 要 实现 广度 优先 搜索 一 般 都 采用 队 
列 作为 辅助 结构 。 把 下 一 步 所 有 可 能 达到 的 状态 都 列举 出 来 元 效 在 这 个 队列 中 ， 然 后 顺序 
取出 来 分 别 进行 处 理 ， 处 理 过 程 中 把 再 下 一 步 的 状态 放 在 队列 里 …… 于 队列 的 操作 遵循 
先进 先 出 的 原则 ， 在 这 个 处 理 过 程 中 ， 只 有 在 前 一 步 的 所 有 情况 都 处 理 完 后 ， 才 能 开始 后 
面 一 步 各 情况 的 处 理 。 NAN 六 

要 模拟 农夫 过 河 问 题 ， 首 先 需 要 选择 一 个 对 问题 中 每 个 角色 的 位 置 进 行 描 述 的 方法 。 
一 个 很 方便 的 办 法 是 用 四 位 二 进 制 数 顺序 分 别 表示 农大 、 狼 、 白 菜 和 羊 的 位 置 。 例 如 ， 用 
0 表示 农夫 或 者 某 东西 在 河 的 南岸 , 1 表示 在 河 的 北岸 ， 则 整数 5( 其 二 进 制 表 示 为 0101) 
表示 农夫 和 白菜 在 河 的 南岸 ,而 狼 和 羊 在 北岸 。 

完成 了 上 面 的 准备 工作 ， 现 在 的 问题 变 成 ， 从 初始 状态 二 进 制 0000( 全 部 在 河 的 南岸 ) 
出 发 , 寻找 一 种 全 部 由 安全 状态 构成 的 状态 序列 六 它 以 二 进 制 1111( 全 部 到 达 河 的 北岸 ) 为 
最 终 目标 ， 并 且 序 列 中 的 每 一 个 状态 都 可 以 从 前 一 状态 通过 农夫 (可 以 带 一 样 东西 ) 划 船 过 
河 的 动作 到 达 。 | 

为 简化 算法 ， 要 求 在 序列 中 不 应 该 出 现 重复 的 状态 。 为 了 实现 广度 优先 搜索 ， 算 法 中 
需要 使 用 一 个 整数 队列 moveTo， 它 的 每 个 元 素 表 示 一 个 可 以 安全 到 达 的 中 间 状 态 。 另 外 
还 需要 一 个 数据 结构 记录 已 被 访问 过 的 各 个 状态 ， 以 及 已 被 发 现 的 能 够 到 达 当 前 这 个 状态 
的 路 径 。 
于 在 这 个 问题 的 解决 过 程 中 需要 列举 的 所 有 状态 (二 进 制 0000 一 1111) 一 共 16 种 , 所 
以 可 以 构造 一 个 包含 16 个 元 素 的 整数 顺序 表 来 满足 以 上 的 要 求 。 用 顺序 表 的 第 i 个 元 素 记 
录 状 态 i 是 否 已 被 访问 过 ， 若 已 被 访问 过 则 在 这 个 顺序 表 元 素 中 记 入 前 趋 状态 值 ， 算 法 中 
把 这 个 顺序 表 称 为 route。route 的 每 个 分 量 初始 化 值 均 为 -1， 每 当 我 们 在 队列 中 加 入 一 个 
新 状态 时 ， 就 把 顺序 表 中 以 该 状态 作 下 标的 元 素 的 值 改 为 达到 这 个 状态 的 路 径 上 前 一 状态 
的 下 标 值 。route 的 一 个 元 素 具 有 非 负 值 ， 表 示 这 个 状态 已 访问 过 ， 或 正 被 考虑 。 最 后 我 们 
可 以 利用 route 顺序 表 元 素 的 值 建立 起 正确 的 状态 路 径 。 

用 队列 解决 农夫 过 河 问题 ， 算 法 如 下 : 

#include <stdio.h> 

#include <stdlib.h> 

typedef int DataType; 
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本 章 小 结 


本 章 主要 介绍 栈 与 队列 的 基本 概念 、 顺 序 存储 表示 与 基本 操作 ， 以 及 栈 与 队列 的 链 式 
存储 表示 与 基本 操作 。 

栈 的 链 式 存储 结构 称 链 栈 。 栈 项 指针 是 链表 的 头 指针 。 我 们 知道 ， 栈 是 先进 后 出 的 ， 
队列 是 先进 先 出 的 ， 共 同 点 是 只 允许 在 端点 处 插入 和 删除 元 素 。 栈 都 是 在 一 端 进 与 出 ， 而 
队列 是 在 一 端 进 ， 在 另 一 端 出 。 

通过 分 析 队 列 的 适用 范围 ， 以 达到 应 对 各 种 算法 出 现 的 问题 。 最 后 把 栈 与 队列 应 用 于 





| 
6 | 


实践 问题 ， 用 火车 车 厢 重 排 问题 、 四 则 运算 表达 式 求 值 问 题 、 渡 口 管理 问题 和 农夫 过 河 问 
题 来 进一步 地 分 析 并 理解 栈 与 各 种 队列 的 应 用 。 


习题 与 思考 








4.1 单 选 题 
。 一 个 栈 的 输入 序列 为 1，2，3，…，n， 考 输出 序列 的 第 一 个 元 素 是 n， 则 输出 的 
yp 个 二 家 二 )。 


A. 不 确定 B. n-i+l | D. n-i 
2. 有 6 个 元 素 7，6，5，4，3，2，1， 从 7 开始 顺序 进 栈 ， 则 下 列 哪 一 个 不 是 合法 的 
出 栈 序列 ? (  ) 4 
A. 7543612 B. 4531267 C. 7346521 D. 2341567 








3. 车 栈 采用 顺序 存储 方式 存储 , 现 两 栈 共享 空间 V[m], top[i] 代 表 第 ii=1.2) 个 栈 栈 项 ， 
栈 1 的 底 在 V[0]， 栈 2 的 底 在 VIm-1]， 则 栈 满 的 条 件 是 ( ， )。 











A. ltop[2]-top[1]|=0 -B. top[1]+1=top[2] 
C. top[1]+top[2]=m \ ~ D. top[1]=top[2] 
4. 执行 完 下 列 语句 段 后 ，i 值 为 (，。)a<、 
int fl(int x) SNSF 
{ return ((x>0) ? x* so Sy wx 
int i; ~ 六 > 
i =£(£(1)); RN wt 
交 B. 4 FF D. 无 限 递归 


5. 设 栈 S 和 队列 Q 的 初始 状态 为 空 i 元 素 e1，e2，e3，e4，e5 和 e6 依次 通过 栈 S， 
-个 元 素 出 栈 后 即 进 队 列 Q， 若 6 个 元 素 出 队 的 序列 是 e2，e4，e3，e6，e5，el， 则 栈 S 
的 容量 至 少 应 该 是 ( 。 )。 

A. 6 B. 4 G: 3 D. 2 

4.2 ”填空 题 

1. S 表示 入 栈 操作 ，X 表示 出 栈 操作 ， 若 元 素 入 栈 的 顺序 为 1234， 为 了 得 到 1342 出 
栈 顺 序 ， 相 应 的 S 和 X 的 操作 串 为 

2. 顺序 栈 用 data[m] 存 储 数据 ， 楼 顶 指针 是 top( 楼 顶 指针 指向 当 前 栈 项 元 素 所 在 单元 的 
位 置 )， 则 值 为 x 的 元 素 入 栈 的 操作 是 

3. 区 分 循环 队列 的 满 与 空 ， 有 两 种 方法 ， 它们 是 

4. 循环 队列 的 引入 ， 是 为 了 克服 。 
5， 队 列 是 限制 插入 只 能 在 表 的 一 端 ， 而 删除 在 表 的 另 一 端 进行 的 线性 表 ， 其 特点 是 








和 











4.3 ”思考 题 
1. 什么 是 栈 ? 什么 是 队列 ? 它们 各 自 的 特点 是 什么 ? 
2. 线性 表 、 栈 、 队 列 有 什么 异同 ? 











日 
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Ta 

3， 简 述 栈 的 入 栈 、 出 本 操作 的 过 程 。 

4. 简 述 在 循环 队列 中 入 队 、 出 队 操作 的 过 程 。 

5. 在 什么 情况 下 才能 使 用 栈 、 队 列 等 数据 结构 ? 

6， 假 设 以 S$ 和 X 分 别 表示 入 栈 操作 和 出 栈 操作 ， 则 对 初 态 和 终 态 均 为 空 的 栈 操作 可 
S 和 XX 组 成 的 序列 表示 (如 SXSX)。 

(1) 试 指出 判别 给 定 序列 是 否 合法 的 一 般 规 则 。 

(2) 两 个 不 同 合法 序列 (对 同一 输入 序列 ) 能 否 得 到 相同 的 输出 元 素 序列 ? 如 能 得 到 , 请 


举例 说 明 。 


7. 在 一 个 算法 中 需要 建立 多 个 堆栈 时 ， 可 以 选用 下 列 3 种 方案 之 一 : 

(1) 分 别 用 多 个 顺序 存储 空间 建立 多 个 独立 的 堆栈 ; 

(2) 多 个 堆栈 共享 一 个 顺序 存储 空间 ; - 

(3) 分 别 建立 多 个 独立 的 链接 堆栈。 [从 

试问 : 这 3 种 方案 之 间 相 比较 各 有 什么 优 缺 点 ? 《AN 

8. 在 某 程序 中 , 有 两 个 栈 共享 一 个 一 一 维 数组 空间 、 PPm SPACE[0] 和 SPACE[N-1] 





分 别 是 两 个 栈 的 栈 底 。 


(1) 对 栈 1、 栈 2， 试 分 别 写 出 (元 素 妇 入 本 前 主要 语句 和 出 栈 的 主要 滞 句 。 
对 栈 1 栈 2， 试 分 别 写 出 栈 满 、 栈 空 的 条 件 。 
当 用 一 个 循环 数组 q[m] 表 示 队 列 时 ， 该 队列 只 有 一 个 队列 头 指针 front， 不 设 队列 





et rear， 而 改 置 计数 器 count 用 以 记录 队列 中 结 点 的 个 数 。 


(1) 编写 实现 队列 判 空 、 入 队 s 出 队 的 3 个 基本 运算 算法 ; 
(2) 队列 中 能 容纳 元 素 的 最 多 个 数 是 多 少 ? NA 
10， 设 输入 元 素 为 -1S 2s 3、P 和 A， 输入 次 序 为 1、2、3、P、A。 当 所 有 元 素 均 到 


达 输 出 序列 后 ， 有 哪些 序列 可 以 作为 高 级 语言 的 变量 名 。 


11. 因果 宪 在 条 环 队列 的 瑞 才 可 以 直行 插入 和 间 队 操作. 要 求 ; 
(1) 写 出 循环 队列 的 类 型 定义 。 
C) 写 出 “从 队 尾 副 除 ”和 “从 队 头 插入 ”的 算法 。 





串 、 多 维 数组 与 特殊 矩阵 


(1) 掌握 串 的 类 型 定义 、3 种 存储 表示 及 相应 的 存储 结构 。 

(2) 掌握 串 的 模式 匹配 算法 。 

(3) 掌握 特殊 矩阵 的 压缩 存储 表示 方法 。 

(4) 理解 稀 朴 矩阵 的 两 类 压缩 存储 方法 的 特点 及 其 适用 范围 ， 领 会 以 三 元 组 表示 稀 玻 
和 矩阵 时 进行 矩阵 运算 所 采用 的 处 理 方法 。 


| 





[类 Wy 定 XX | 
We 


顺序 存储 


[ER 












串 的 模式 匹配 
































| 类 型 定义 
多 维 数组 
顺序 存储 表示 
对 称 矩 形 
特殊 短 阵 的 讨 缩 存储 Fd 三 角 和 矩形 
可 | 对 朋 拢 形 
过 天 让 了 | Se 
| 宇 链表 法 
应 用 实践 





(1) 串 与 数组 的 存储 结构 。 
(2) 串 的 表示 和 实现 。 
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(3) 特殊 矩阵 和 稀疏 矩阵 的 压缩 存储 方法 及 运算 的 实现 。 
(4) 数组 类 型 的 定义 及 其 存储 表示 。 


计算 机 上 的 非 数值 处 理 的 对 象 基本 上 是 字符 串 数据 。 字符 串 简称 串 ， 是 一 种 特殊 的 线性 表 ， 
因此 串 的 存储 方法 也 是 线性 表 的 一 般 方法 。 本 章 讨 论 字符 串 的 基本 概念 、 存 储 方法 和 基本 操作 。 
模式 匹配 运算 字符 串 是 最 重要 的 操作 ， 也 是 本 章 学 习 的 难点 。 

从 学 习 利用 高 级 语言 编制 程序 开始 ， 数 组 是 大 家 惯用 的 存储 批量 数据 的 工具 ， 前 面 讨 论 的 
线性 结构 的 顺序 存储 结构 也 都 是 利用 数组 来 描述 的 ， 那 么 数组 本 身 又 是 怎么 实现 的 呢 ? 学 习 多 


维 数组 的 目的 主要 是 了 解数 组 类 型 的 特点 及 在 高 级 编程 语言 中 的 实现 方法 ， 更 有 利于 学 习 、 理 
解 特殊 矩阵 的 相关 运算 。 
5.1 串 


5.1.1 串 的 类 型 定义 
串 ( 或 字符 串 ) 是 由 零 个 或 多 个 字符 组 成 的 有 限 序列 ， 一 般 记 作 


S=“clcicz…cn”(n 二 0) 
其 中 ，s 为 串 名 ， 用 双 引 号 括 起 来 的 字符 序列 是 串 的 值 ;gi(0 入 i 和 mrD) 可 以 是 字母 、 数 字 或 
其 他 字符 ;， 双 引号 为 串 值 的 定 界 符 ， 不 是 串 的 一 部 分 所 串 的 字符 数目 n 称 为 串 的 长 度 。 零 
个 字符 的 串 称 为 空 串 ， 通 常 以 两 个 相 邻 的 双 引 号 来 表示 空 串 ， 如 s=“”， 它 的 长 度 为 零 。 


< 注意 
[ 要 注意 区 分 空 冲 和 空格 串 (也 称 空白 串 )， 空 格 串 仅 由 空格 组 成 ， 如 sS=“ ”， 长 度 不 
为 零 








串 中 任意 个 连续 字符 组 成 的 序列 称 为 该 串 的 子 串 。 包 含 子 串 的 串 称 为 主 串 ， 通 常 将 子 
串 在 主 串 中 首次 出 现时 该 子 串 的 首 字符 对 应 的 主 串 中 的 序号 ， 定 义 为 子 串 在 主 串 中 的 序号 
(或 位 置 )。 特 别 地 ， 空 串 是 任意 串 的 子 串 ， 任 意 串 是 其 自身 的 子 串 。 

称 两 个 串 是 相等 的 ， 是 指 这 两 个 串 的 长 度 相等 ， 同 时 其 各 个 对 应 位 置 的 字符 都 相等 。 

其 抽象 数据 类 型 定义 如 下 : 


ADT String { 
数据 对 象 : D ={ ai | ai 属 char 类 型 ，i=1,2,...,n，n>=0 } 
数据 关系 : R ={ <ai-i ,as >1ai-l ,aiED, i=2,...n } 
基本 操作 : 
Insert(*S, pos, T) // 插 入 : 在 s 的 第 pos 个 字符 前 插入 串 T 
Delete(*S，pos，len) // 删 除 : 删除 Ss 中 从 第 pos 个 字符 开始 长 度 为 len 的 子 串 
Substring(&Sub, S§, pos, len) 


// 取 子 串 : 取 s 中 从 第 pos 个 字符 开始 长 度 为 len 的 子 串 



























0 
©O -一 ”~ 


strCopy(&s, T) // 复 制 串 : 把 了 T 赋 给 S 

strEqual(s, T) // 是 否 相等 : 判断 S 和 了 是否 相 等 
StrCompare(S，T) // 串 的 比较 : 对 s 和 了 进行 比较 
Concat(T，S1，S2) // 连 接 串 : 连接 S1 和 s2 

Index(S, T, pos) /7 匹配 串 : 从 s 中 第 pos 个 字符 之 后 开始 与 了 匹配 


} ADT String 
5.1.2 ” 串 的 顺序 存储 


于 串 实际 上 是 一 种 特殊 的 线性 表 ， 它 的 元 素 仅 由 一 个 字符 组 成 ， 因 此 串 的 存储 方法 
也 是 线性 表 的 一 般 方法 ， 常 见 的 有 顺序 存储 和 链 式 存储 两 种 方法 。 
线性 表 的 顺序 存储 一 样 ， 串 的 顺序 存储 结构 就 是 采用 与 其 逻辑 结构 相对 应 的 存储 结 
构 ， 即 串 的 各 个 字符 按 顺序 存 入 连续 的 存储 单元 中 去 ， 逻 辑 上 相 邻 的 字符 在 内 存 中 也 是 相 
邻 的 ， 有 时 称 为 顺序 串 。 KN 
串 的 最 简单 程序 存储 是 采用 非 紧缩 格式 ， 即 每 一 个 存储 单元 中 存放 一 个 字 节 ， 所 占 存 
储 单元 数目 即 为 串 的 长 度 。 采用 这 种 存储 结构 , 随机 读 / 写 串 中 指定 的 第 i 个 字符 最 为 方便 
存 取 的 速度 最 快 。 但 每 一 个 存储 单元 本 可 以 放下 多 个 字符 ， 只 放 一 个 字符 不 能 充分 利用 存 
储 空 间 。 NN 

为 了 充分 利用 存储 空间 ， 也 可 以 采用 紧缩 格式 的 顺序 存储 结构 ， 即 根据 存储 单元 的 容 
量 给 每 个 单元 存 入 多 个 字符 ， 最 末 一 个 单元 如 果 没 有 占 满 ， 可 填充 空格 符 。 采 用 这 种 存储 
结构 ， 从 所 占 存储 单元 的 数目 不 能 求 出 准确 的 串 长 度 (末尾 单元 可 能 空余 单元 )， 故 需要 对 
串 的 长 度 进 行 设 定 。 六 
在 串 的 顺序 存储 结构 中 ; 表示 串 的 长 度 通 常 有 两 种 方法 ， 一 种 方法 是 设置 一 个 串 的 长 
度 参数 ， 此 种 方法 的 优点 是 便于 在 算法 中 用 长 度 参数 控制 循环 过 程 ， 另 一 种 方法 是 在 串 值 
末尾 添加 结束 标记 %0”， 此 种 方法 的 优 识 是 便于 系统 自动 实现 。 

例如 , 定义 二 个 串 变 量 String s, 则 这 种 存储 方式 可 以 直接 得 到 串 的 实际 长 度 : s.length， 
如 图 5.1 所 示 。 

在 串 尾 存储 一 个 不 会 在 串 中 出 现 的 特殊 字符 作为 串 的 终止 符 ， 以 此 表示 串 的 结尾 ， 如 
图 5.2 所 示 ， 它 用 “0” 来 表示 串 的 结束 。 这 种 存储 方法 不 能 直接 得 到 串 的 长 度 ， 通 过 判 
断 当前 字符 是 否 是 “0” 来 确定 串 是 否 结束 ， 从 而 求 得 串 的 长 度 。 
S.data 

人 ls MAXSIZE-1 


[aldleldaj。jrlslhlililel >- | 
s.length 


图 5.1 串 的 顺序 存储 方式 1 
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char s[MAXSIZE] 
A 渤 3 MAXSIZE-1 
TalesJdjeTJslsTiTifeol [| | 
图 5.2 串 的 顺序 存储 方式 2 
串 的 顺序 存储 结构 就 是 用 数组 存放 串 的 所 有 字符 ， 数 组 有 前 态 数组 和 动态 数组 两 种 。 


os 
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1.， 静态 数组 结构 
静态 数组 结构 也 称 为 定 长 数组 结构 ， 其 数据 结构 类 型 定义 如 下 : 





静态 数组 下 串 基 本 操作 的 实现 见 算法 5.1 一 算法 5.4。 其 中 ， 算 法 5.2 是 在 串 S 的 pos 
位 置 之 前 插入 子 串 T， 算 法 5.3 是 删除 串 S 从 pos 位 置 开始 长 度 为 len 的 子 串 值 ， 算 法 5.4 
是 取 串 S 从 pos 位 置 开始 长 度 为 len 的 子 串 值 赋 给 串 T。 

1) 子 串 插入 

算法 5.1 ”静态 数组 下 串 的 子 串 插 入 于 





2) 子 串 删 除 
算法 5.2 ”静态 数组 下 串 的 子 串 删除 
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3) 取 子 串 
算法 5.3 ”基态 数组 下 串 的 子 串 提取 


~ 


全 申 的 复制 > 
算法 5. aa 效 ， 


5) 判断 串 是 否 相等 
算法 5.5 ”判断 静态 数组 下 串 是 否 相等 
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6) 串 比 较 

对 串 S 和 T 进 行 比较 ， 若 S>T， 则 返回 值 大 于 0; 若 S=T， 则 返回 值 为 0， 若 S<T， 
则 返回 值 小 于 0。 

算法 5.6 ”静态 数组 下 串 的 比较 








7) 串联 接 
我 们 用 字符 串 工 返回 字符 串 S1 Ee S2 联接 而 成 的 新 串 。 基 于 串 S1 和 S2 长 度 的 
回 不 同情 况 ， 串 全 的 产生 可 能 有 如 下 3 种 情况 2 
(1) S1. bogies <MAXSIZE, 此 时 不 发 生 蕉 断 ， 见 算法 5.7 情况 @。 
(2 S1.1 SIZE 而 有 length >MAXSIZE， 此 时 将 串 S2 
【参考 图 文 】 的 一 me ) 中 子 串 ， 见 算法 5.7 情况 @。 
(3) S1. la SIZE, rnin 并 非 联接 的 结果 ， 而 是 串 S1 的 部 分 或 全 
部 ， 见 算法 5. 
算法 5.7 < a 
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该 算法 若 未 截断 ， 则 返回 TRUE， 和 否则 返回 FALSE。 “ 


8) 串 的 匹 本 人 
若 主 申 $ 中 第 pos 个 字符 之 后 存在 与 T 机 和 的 也 回 第 一 个 这 样 的 子 申 在 $ 中 
的 位 置 ， 否 则 返回 0。 
算法 5.8 前 态 数 组 下 中 的 匹配 


2， 动态 数组 结构 
为 了 实现 动态 存储 ， 我 们 定义 动态 数组 的 结构 体 如 下 : 


ES 
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与 静态 数组 结构 相 比 ， 其 定义 中 增加 了 一 个 指出 动态 数组 长 度 的 域 ， 为 每 次 动态 存储 
空间 提供 增加 量 。 同 时 ， 动 态 数组 下 串 的 基本 操作 增加 了 初始 化 操作 和 撤销 操作 。 

1) 初始 化 

该 操作 的 目的 是 建立 存储 串 的 动态 数组 空间 以 及 给 相关 的 数据 域 赋值 。 

算法 5.9 动态 数组 下 串 的 初始 化 












2) 插入 子囊 下 
该 操作 的 目的 是 在 串 S 的 pos 位 ; 入 子 串 工 。 
算法 5.10 ee 沁 
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realloc(mem_address,size) 函 数 实现 将 mem_address 所 指 的 已 分 配 内 存 区 的 大 小 改 为 
size， 新 分 配 内 存 区 中 原样 保存 原 内 存 区 中 的 数据 值 。 

在 动态 数组 结构 下 ， 当 判断 子 串 插入 主 串 后 主 串 空间 不 足 时 ， 可 以 为 主 串 S 重新 申请 
更 大 的 内 存 空间 ， 然 后 插入 子 串 ， 而 在 静态 数组 结构 下 ， 此 种 情况 必须 出 错 返 回 。 

3) 删除 子 串 

算法 5.11 动态 数组 下 串 的 子 串 删除 


4) 取 子 串 
算法 5.12 动态 数组 下 串 的 子 串 提取 
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5) 销毁 操作 
算法 5.13 ”动态 数组 下 串 的 销毁 





void Destroy (DStringxS){ 
free(S->str); 
S->maxLength=07 
S->length=0; 





} 
5.1.3 ” 串 的 链 式 存储 


串 的 链 式 存储 结构 与 线性 表 的 链 式 存储 类 似 ， 是 将 存储 区 分 成 许多 “ 结 点 ”， 每 个 结 
点 包含 一 个 存放 字符 的 域 和 一 个 存放 指向 下 一 个 结 点 的 指针 域 。 采用 链 式 存储 吉 构 的 串 称 
为 链 串 。 由 于 串 的 特殊 性 一 一 每 个 元 素 只 包含 一 个 字符 ， 因 此 ,每 个 结 点 可 以 存放 一 个 字 
符 ， 也 可 以 存放 多 个 字符 。 图 5.3 和 图 5.4 分 别 表示 了 存储 密度 为 4 和 1 的 链 式 存储 结构 。 


beat 一 [bd 村 [sj i TH 


图 5.3 多 字符 结 点 串 的 链 式 存储 结构 


图 5.4 单字 符 结 点 串 的 链 式 存储 结构 


当 结 点 大 小 大 于 1( 如 结 点 大 小 等 于 4) 时 ， 链 串 的 最 后 - 一 个 结 8 点 的 各 个 数据 域 不 一 定 总 
能 全 被 字符 占 满 此 时 ， 应 在 这 些 未 占用 的 数据 域 里 补 上 不 属于 字符 集 的 特殊 符号 (如 “#” 
字符 )， 以 示 区 别 (如 图 5.3 中 的 最 后 一 个 结 点 )~ 
为 了 实现 链 串 的 基本 操作 ， 串 的 链 式 存储 结构 类 型 描述 如 下 : 


上 typedef ‘struct ‘node F 3 














char data; 
struct node *next; 
}LinkstrNode; 
typedef LinkStrNode * LinkSstring; // 链 式 串 的 指针 


在 链 式 存储 方式 中 ， 结 点 大 小 的 选择 和 顺序 存储 方式 的 格式 选择 一 样 都 很 重要 ， 它 直 
接 影响 着 串 处 理 的 效率 。 在 各 种 的 串 处 理 系 统 中 ， 所 处 理 的 串 往往 很 长 或 很 多 ， 例 如 ， 一 
本 书 的 儿 百 万 个 字符 ， 情 报 资料 的 成 千 上 万 个 条 目 ， 这 要 求 我 们 考虑 串 值 的 存储 密度 。 存 
储 密度 可 定义 为 














-er_ 串 值 所 占 的 存储 位 
存储 密度 次 际 分 配 的 存储 位 6 

显然 ， 存储 密度 小 (如 结 点 大 小 为 1 ])， 运 算 处 理 方便 ， 然 而 ， 存 储 占用 量 大 。 如 果 在 串 
处 理 过 程 中 需要 进行 内 、 外 存 交 换 ， 则 会 因为 内 、 外 存 交换 操作 过 多 而 影响 处 理 的 总 效率 。 
应 该 看 到 ， 串 的 字符 集 大 小 也 是 一 个 重要 因素 。 一 般 地 ， 字 符 集 小 ， 则 字符 的 机 内 编码 就 
短 ， 这 也 影响 串 值 的 存储 方式 的 选取 。 下 面 给 出 链 串 的 基本 操作 。 


2 0 
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1.， 链 串 的 初始 化 
算法 5.14 链 串 的 初始 化 





2. 链 串 的 赋值 
算法 5.15 链 串 的 赋值 


3， 求 链 于 的 长 度 ， = 
算法 5.16、 求 链 囊 的 长 度 





4. 链 囊 的 复制 
算法 5.17 链 串 的 复制 
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| 





5.， 链 串 的 比较 
算法 5.18 链 串 的 比较 


6. 链 囊 的 联接 
算法 5.19 链 串 的 联接 





7. 子 链 串 的 提取 
算法 5.20 子 链 串 的 提取 
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8.， 链 串 的 插入 
算法 5.21 链 串 的 插入 
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9， 链 串 的 替换 
算法 5.22 ” 链 串 的 替换 





5.2” 串 的 模式 匹配 


串 的 模式 匹配 即 子 串 定位 ， 是 一 种 重要 的 串 的 运算 。 设 S 和 T 是 给 定 的 两 个 串 ， 在 主 
串 S 中 找到 等 于 子 串 T 的 过 程 称 为 模式 匹配 (其 中 T 称 为 模式 串 )。 如 果 在 S 中 找到 了 的 子 
串 ， 则 称 匹配 成 功 ， 函 数 返回 T 在 S 中 首次 出 现 的 存储 位 置 (或 序号 )， 和 否则 匹配 失败 ， 返 
回 -1。 


@r 
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为 了 运算 方便 ， 设 字符 串 的 长 度 存放 在 0 号 单元 ， 串 值 从 1 号 单元 开始 存放 ， 这 样 字 
符 序号 与 存储 位 置 一 致 。 本 节 主 要 介绍 模式 匹配 的 简单 算法 和 一 种 改进 的 算法 KMP 算法 )。 


5.2.1 ”模式 匹配 的 简单 算法 


其 基本 思想 是 分 别 利用 计数 指针 i 和 j 指示 主 串 S 和 模式 串 工 中 当前 正 待 比较 的 位 置 。 
首先 将 S[1] 和 T[1] 进 行 比较 ， 若 不 同 ， 将 S[2] 和 T[1] 进 行 比较 …… 直 到 S 中 的 某 一 个 字符 
S[ 和 T[1] 相 同 ， 再 将 它们 之 后 的 字符 进行 比较 ， 若 也 相同 ， 则 如 此 继续 向 下 比较 ， 当 S 
的 某 一 个 字符 S 向 与 T 的 字符 TU] 不 同时 ， 则 S 返回 到 本 趟 开始 字符 的 下 一 个 字符 ， 即 
S[i-j+2], 返回 到 T[1]， 继 续 开 始 下 一 趟 的 比较 , 重复 上 述 过 程 。 若 T 中 的 字符 全 部 比 完 ， 
则 说 明 本 趟 匹配 成 功 ， 否 则 说 明 匹 配 失败 。 
设 主帅 S=“ababcabcacbab ”， 模 式 串 T=“abcac”， 匹 配 过 程 如 图 5.5 所 示 。 
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St , fj=6 
、 图 5.5 ”模式 匹配 的 匹配 过 程 

其 算法 执行 步骤 可 描述 如 下 。 

(1) 判断 匹配 位 置 是 否 到 串 的 末尾 。 

(2) 如 果 主 串 与 模式 串 对 应 字符 相等 ， 继 续 匹 配 下 一 字符 。 

(3) 如 果 主 串 与 模式 串 对 应 字符 不 相等 ， 则 主 串 、 子 串 指 针 回 淹 重 新 开始 下 一 次 匹配 
数据 元 素 。 

(4) 判断 是 否 匹配 成 功 。 

前 面 我 们 已 经 用 串 的 其 他 操作 实现 了 模式 匹配 的 算法 index( )。 现 在 考虑 不 用 串 的 其 他 
操作 ， 而 是 用 基本 的 数组 来 实现 同样 的 算法 。 注 意 ， 这 里 假设 主 串 S 和 要 匹配 的 子 串 T 的 
长 度 都 存在 S[0] 和 T[0] 中 ， 对 应 的 代码 见 算法 5.23。 其 中 i 是 主 串 S 中 当前 位 置 下 标 值 ， 
车 pos 不 为 1， 则 从 pos 位 置 开 始 匹 配 ，j 是 子 串 工 中 当前 位 置 下 标 值 ， 若 ii 小 于 S 的 长 度 
并 且 j 小 于 T 的 长 度 ， 循 环 继续 。 

算法 5.23 ”模式 匹配 的 简单 算法 


int Index(char S[],char T[],int pos){ 
int i=pos; 
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nN 
while(i<=S[0] &&j<=T[0]) 
, 
42(S Li]==T tj]) 
{ 
法 中 和 全 
++j; 
} 
else 
| 
i=i-j+2; 
j=1; 
} 
if(j>T[0]) 


return i-T[0]; 
else 
return 0; 


} 


/10 号 单元 存放 串 的 长 度 


//i 退回 到 上 次 匹配 首位 的 下 一 位 
//j 退回 到 子 串 了 的 首位 


下 面 分 析 它 的 时 间 复 杂 度 ， 设 串 $ 长 度 为 ny 串 T 长 度 为 m。 匹配 成 功 的 情况 下 考虑 


两 种 极端 情况 : 


(1) 在 最 好 情况 下 ,每 趟 不 成 功 的 匹配 都 发 生 在 第 一 对 字符 比较 时 。 例 如 , S=“aaaaabe”， 
T=“bc”， 设 匹配 成 功 发 生 在 ;Si 处 ， 则 字符 比较 次 数 在 前 面 -1 趟 中 共 比 较 了 i-1 次 ， 第 





i 趟 成 功 匹配 共 比 较 了 m 次 ， 所 以 总 共 


较 了 i 订 1+m 次 x 所 有 匹配 成 功 的 可 能 共有 nr-m+l 


种 ， 设 从 S 自 开始 与 全 串 匹 配 成 功 的 概率 为 pi, 在 等 概率 情况 下 p=1/(n-m+1)， 因 此 最 好 


情况 下 平均 比较 的 次 数 是 


nm+l nmfl 


即 最 好 情况 下 的 时 间 复 杂 度 是 On+m)。 





-m+l 


by pix(i-l+m)= >， 


x(i-ltm= (5.2) 


(2) 在 最 坏 的 情况 下 ， 每 趟 不 成 功 的 匹配 都 发 生 在 T 的 最 后 一 个 字符 。 例 如 ， S= 
“aaaaaaaaaabc”，T=“aaab”， 设 匹配 成 功 发 生 在 S[] 处 ， 则 在 前 面 订 1 趟 匹配 中 共 比 较 了 
(GDxm 次 ， 第 i 趟 成 功 匹 配 共 比较 了 m 次 ， 所 以 共 比较 了 ixm 次 ， 因 此 最 坏 情况 下 平均 


























比较 次 数 是 
n-m+l] n—m+l 
Dom mm (5.3) 





即 最 坏 情 况 下 的 时 间 复 杂 度 是 O(nxm) 。 


当 模 式 串 为 “00000001”， 而 主 串 为 “00000000000000000000000000000000000000000 
00000000000” 时 ， 由 于 模式 串 中 前 7 个 字符 均 为 “0”， 主 串 中 前 52 个 字符 也 均 为 “0”， 




















每 趟 比较 都 在 模式 串 的 最 后 一 个 字符 出 现 不 等 时 ， 将 指针 回溯 i-6 的 位 置 上 ， 并 从 模式 串 














的 第 一 个 字符 开始 重新 比较 ， 整 个 匹配 过 程 中 指针 i 需要 回溯 45 次 ， 则 while 循环 次 数 为 
46*8(index*m)。 可 见 ， 算 法 5.23 在 最 坏 情况 下 的 时 间 复 杂 度 为 Omxm) 。 这 种 情况 在 只 
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0、1 两 个 字符 的 文本 串 处 理 中 经 常 出 现 . 01 串 可 以 用 在 许多 应 用 之 中 ， 例如， 一 些 计算 机 
的 图 形 显示 就 是 用 画面 表示 为 一 个 01 串 , 一 页 书 就 是 一 个 儿 百 万 个 0 和 1 组 成 的 串 。 在 二 
进位 计算 机 上 实际 处 理 的 都 是 01 串 ,一 个 字符 的 ASCIL 码 也 可 以 看 作 8 个 二 进位 的 01 串 。 
包括 汉字 存储 在 计算 机 中 处 理 时 也 是 作为 一 个 01 串 和 其 他 的 字符 串 一 样 看 待 。 因 此 , 我 们 
有 必要 介绍 一 种 改进 的 模式 匹配 算法 ， 即 KMP 算法 。 keg 


5.2.2 KMP 算法 EE 中 


KMP 算法 是 由 D.E.Knuth 与 JH.Morris 和 VR.Pratt 同时 发 现 的 ， 因 此 人 【参考 图 文 】 
们 称 它 为 克 努 特 一 莫 里 斯 一 普 拉 特 操作 (简称 KMP 算法 )。 此 算法 可 以 在 Oon+m) 的 时 间 数 
量 级 上 完成 串 的 模式 匹配 操作 。 其 改进 在 于 ， 每 当 一 趟 匹配 过 程 中 出 现 字符 比 较 不 等 时 ， 
不 需 回溯 i 指针 ， 而 是 利用 已 经 得 到 的 “部 分 匹配 ”的 结果 将 模式 串 向 右 “ 滑 动 ” 尽 可 能 
远 的 一 段 距离 后 ， 继 续 进行 比较 。 下 面 先 从 具体 例子 看 起 。 \ 

可 顾 图 5.5 中 的 匹配 过 程 示例 ， 在 第 三 趟 的 匹配 中 ， 当 .二 7、j=5 字符 比较 不 等 时 ， 又 
从 4、 二 =1 重新 开始 比较 。 然 而 ， 经 仔细 观察 发 现 ,i=4、 计 1，i=5、j=1 及 i=6、j=1 这 3 
次 比较 是 不 必 进 行 的 。 因 为 从 第 三 趟 部 分 匹配 的 结果 就 可 得 出 ， 主 串 中 第 4、5、6 个 字符 
必然 是 “b”、‘c” 和 “a”( 即 模式 串 第 2、3、4 个 字符 )。 因 为 模式 串 中 的 第 一 个 字符 是 a， 
因此 它 不 需 再 和 这 3 个 字符 进行 比较 ， 而 仅 需 将 模式 串 向 右 滑动 3 个 字符 的 位 置 进行 =7、 
j=2 时 的 字符 比较 即 可 。 同 理 ， 在 第 二 趟 史 配 中 出 现 字 符 不 等 时 ， 仅 需 将 模式 串 向 右 移动 
两 个 字符 的 位 置 继续 进行 =3、j= 丰 时 的 字符 比较 。 由 此 ， 奸 整 个 匹配 过 程 中 ， i 指针 没有 
回溯 ， 如 图 5.6 所 示 。 


| =3 ret 
















































































以 一 梢 ababcjabcacbab hy ababe ab 
第 - 趟 sb 六 号 > 赴 abe ae 
天 1 fs 
je 
第 三 不 ababcabeceaecbab 
- 二 
$3 b=6 


5.6 ”改进 算法 的 匹配 过 程 示例 


当主 串 中 第 i 个 字符 与 模式 串 中 的 第 j 个 字符 “ 失 配 ”( 即 比较 不 相等 ) 时 ， 主 串 中 第 i 
个 字符 (i 指针 不 回溯 ) 应 与 模式 串 中 哪个 字符 再 比较 ? 

假设 应 与 模式 串 中 第 k(k<j) 个 字符 继续 比较 ， 则 模式 串 中 前 k-1 个 字符 的 子 串 必须 满 
足下 列 关 系 ; 


























"PiPz “Pry = SipsSiks2" Si (5.4) 
而 已 经 得 到 的 匹配 结果 是 
PranaPia2 Pia = "StiSias2" "Si (5.5) 


由 式 (5.4) 和 式 (5.5) 推 得 下 列 等 式 


oe 





SS) 
‘pip2 …pk = "Pj xnPj kr2""*Pir (5.6) 
反之 ， 若 模式 串 中 存在 满足 式 (5.6) 的 两 个 子 串 ， 则 匹配 过 程 中 ， 主 串 中 第 i 个 字符 与 
模式 串 中 第 j 个 字符 比较 不 等 时 ， 仅 需 将 模式 串 向 右 滑动 至 模式 串 中 第 k 个 字符 与 主 串 中 
第 i 个 字符 对 章 ， 此 时 ， 模 式 串 中 前 k-1 个 字符 的 子 串 'pip, …pu "必定 与 主 下 中 第 1 个 字 
符 之 前 长 度 为 k-1 的 子 串 's sa…si 相等 ， 由 此 ， 匹 配 仅 需 从 模式 串 中 第 k 个 字符 与 
主 串 中 第 i 个 字符 比较 起 继续 进行 。 
若 令 next[j]=k， 则 next[j] 表 明 当 前 模式 串 中 第 j 个 字符 与 主 串 中 相应 字符 “ 失 配 ”时 ， 在 
模式 申 中 需 重新 和 主 串 中 该 字符 进行 比较 的 字符 位 置 。 由 此 可 引出 模式 串 的 next 函数 的 定义 : 
0， 当 j=] 时 
Max 人 tk|1l<k<j 且 'pip…pe ='pPar PP (5.7) 
1， 其 他 情况 YA 
由 定义 可 推出 模式 串 的 next 函数 值 如 下 : 


j |12345678 
模式 曲 abaaboat 
nextj] 0 134.22312 


在 求 得 模式 的 next 函数 之 后 ， 匹 配 可 如 下 进行 : 

假设 以 指针 i 和 j 分 别 指示 主 串 和 模式 串 中 正 待 比较 的 字符 ， 令 i 的 初 值 为 pos，j 的 
初 值 为 1。 若 在 匹配 过 程 中 si=p;, 则 并 和 j 分 别 增 1， 否 则 ;%i 不 变 ， 而 j 退 到 next[j] 的 位 置 
再 比较 ， 若 相等 ， 则 指针 各 自 增 1， 和 奋 则 j 再 退 到 下 元 企 next 值 的 位 置 ， 以 此 类 推 ， 直 到 
下 列 两 种 可 能 : 一 种 是 j 退 到 某 个 next 值 (next[next[.::next[j] .…]]) 时 字符 比较 相等 ， 则 指针 
各 自 增 1， 继 续 进 行 匹 配 ; 另 一 种 是 j 退 到 值 为 零 ( 即 模式 串 的 第 一 个 字符 “ 失 配 ”)， 则 此 
时 需 将 模式 串 继 续 向 右 滑动 一 个 位 置 ， 即 炎 主 串 的 下 一 个 字符 si 开始 和 模式 串 重新 开始 
匹配 。 图 5.7 所 示 正 是 上 述 匹配 过 程 的 一 个 例子 。 















































next[j] 














i=2 l= 

EE 证 中 acabaabaabcacaabc pe 主 串 acabaabaabcacaabec 
-是 到 

第 赵 模 作 中 ab 第 -- 翅 模式 中 a 

人 2 next[2]=1 ti=1 next[1]=0 

li ics ， li=8— li=14 
家 三 着 二 出 康生 全 各 用 二 中 acabaabaabeaeceaabe 
模 代 中 abaabec 起 模式 忠 (ab) a ab ceae 

们 一 next[6]=3 1j=3— {tj=9 


5.7 ”利用 模式 串 的 next 函数 进行 匹配 的 过 程 示例 
当 匹配 过 程 中 产生 “ 失 配 ”时 ， 指 针 i 不 变 ， 指 针 j 退回 到 mext[j] 所 指示 的 位 置 上 重 
新 进行 比较 ， 并 且 当 指针 j 退 至 零 时 ， 指 针 i 和 指针 j 需 同时 增 1。 即 车主 串 的 第 i 个 字符 
和 模式 串 中 的 第 1 个 字符 不 等 ， 应 从 主 串 的 第 计 1 个 字符 开始 重新 进行 匹配 。 对 应 KMP 
的 实现 见 算法 5.24， 其 中 i 是 主 串 S 中 当前 位 置 下 标 值 , 车 pos 不 为 1， 则 从 pos 位 置 开 始 
匹配 ; j 表示 子 串 T 中 当前 位 置 下 标 值 。 
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算法 5.24 模式 匹配 的 KMP 算法 





int Index KMP(char S[], char T[], int pos){ 
int i=pos; 
int j=1; 
int next[100]; 
GetNextValue(T, next); 
while(i<=S[0] &&j<=T[0]) 
y 
iF(9==00 lS U1==TII) 
{ 


++i> 
++j; 
} 
else // 指 针 后 退 重新 开始 匹配 
j=next[j]; //j 退回 合适 的 位 置 ，i 值 不 变 
} 
if(j>T[0]) 
return i-T[0]; 
else 
return 0; 


} 


该 算法 返回 子 串 工 在 主 串 S 中 第 pos 个 字符 之 后 的 位 置 若 不 存在 ， 则 函数 返回 值 为 
0。 其 中 T 非 空 ，pos 应 该 在 [1, StrLength(S)] 之 间 。 

KMP 算法 是 在 已 知 模式 串 的 next 函数 值 的 基础 十 执 行 的 ， 那 么 ， 如 何 求 得 模式 串 的 
next 函数 值 呢 ? next 数组 的 求解 方法 是 第 一 位 的 'next 值 为 0， 第 二 位 的 next 值 为 1， 后 面 
求解 每 一 位 的 ,next 值 时 , 根据 前 一 位 进行 比较 。 首 先 将 前 一 位 与 其 next 值 对 应 的 内 容 进 行 
比较 ， 如 果 相等 ， 则 该 位 的 next 值 就 是 前 一 位 的 next 值 加 上 1; 如 果 不 等 ， 向 前 继续 寻找 
next 值 对 应 的 内 容 来 与 前 一 位 进行 比较 , 直到 找到 某 个 位 上 内 容 的 next 值 对 应 的 内 容 与 前 
一 位 相等 为 止 ， 则 这 个 位 对 应 的 值 加 上 1 即 为 需求 的 next 值 ; 如 果 找 到 第 一 位 都 没有 找到 
与 前 一 位 相等 的 内 容 ， 那 么 需求 位 上 的 next 值 即 为 1。 按 上 述 模 式 串 的 next 函数 值 : 

J 12345678 


模式 串 abaabcac 
nextj] 01122312 


我 们 对 其 具体 运算 一 遍 的 过 程 表述 如 下 : 

(1) 前 两 位 必定 为 0 和 1。 

(2) 计算 第 三 位 时 ， 看 第 二 位 b 的 next 值 为 1， 则 把 b 和 1 对 应 的 a 进行 比较 ， 不 同 
则 第 三 位 a 的 next 的 值 为 1， 因 为 一 直 比 到 最 前 一 位 ， 都 没有 发 生 比 较 相 同 的 现象 。 

(3) 计算 第 四 位 时 ， 看 第 三 位 a 的 next 值 为 1， 则 把 a 和 1 对 应 的 a 进行 比较 ， 相 
则 第 四 位 a 的 next 的 值 为 第 三 位 a 的 next 值 加 上 1， 即 2， 因 为 是 在 第 三 位 实现 了 其 next 


值 对 应 的 值 与 第 三 位 的 值 相同 。 
0 uo 
VY 


























zl] 
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(4) 计算 第 五 位 时 ， 看 第 四 位 a 的 next 值 为 2， 则 把 a 和 2 对 应 的 b 进行 比较 ， 不 
同 ， 则 再 将 b 对 应 的 next 值 1 对 应 的 a 与 第 四 位 的 a 进行 比较 , 相同 , 则 第 五 位 的 next 
值 为 第 二 位 b 的 next 值 加 上 1,， 即 2,， 因为 是 在 第 二 位 实现 了 其 next 值 对 应 的 值 与 第 
位 的 值 相 同 。 
(5) 计算 第 六 位 时 ， 看 第 五 位 b 的 next 值 为 2， 则 把 b 和 2 对 应 的 b 进行 比较 ， 相 同 ， 
则 第 六 位 c 的 next 值 为 第 五 位 b 的 next 值 加 上 1， 即 3， 因 为 是 在 第 五 位 实现 了 其 next 值 
对 应 的 值 与 第 五 位 相 
(6) 计算 第 七 位 时 ， 看 第 六 位 c 的 next 值 为 3， 则 把 c 和 3 对 应 的 a 进行 比较 ， 不同， 
则 再 把 第 3 位 a 的 next 值 1 对 应 的 a 与 第 六 位 c 比较, 仍然 不 同 , 则 第 七 位 的 next 值 为 1。 
(7) 计算 第 八 位 时 ， 看 第 七 位 a 的 next 值 为 1， 则 把 a 和 1 对 应 的 a 进行 比较 ， 相 同 ， 
则 第 八 位 e 的 next 值 为 第 七 位 a 的 next 值 加 上 1， 即 2， 因 为 是 在 第 七 位 和 实现 了 其 对 应 
的 值 与 第 七 位 相同 。 

求 next 值 的 对 应 代码 见 算法 5.25。 

算法 5.25 模式 串 的 next 函数 
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void GetNextValue(String T, int *next) { 
int i,j; 
i=1; 
j=0; 
next [1]=0; 
while (i<T[0]) 
{ 
4£(s=0 人 Zi 关 了 了 日 


{ 

二 + 十; 

++3; 

next [i] = j; 
| 
else 


j= next[j]; // 车 字符 不 相同 ， 则 j 值 回 洲 
} 


最 后 说 明 一 点 , 虽然 简单 模式 匹配 算法 的 时 间 复 杂 度 为 O(nxm), 但 在 一 般 情况 下 ,其 
实际 的 执行 时 间 近 似 于 O(ntm)。KMP 算法 仅 当 模式 串 与 主 串 之 间 存 在 许多 “部 分 匹配 ” 
的 情况 下 才 显 得 比 简单 算法 快 得 多 。 


5.2.3 ”KMP 模式 匹配 改进 算法 

















前 面 定义 的 模式 串 的 next 函数 在 某 些 情 况 下 尚 有 缺陷 。 例 如 ， 模 式 串 “a aaa b” 在 
和 主 串 “a aabaaaab” 匹 配 , 当 i=4、j=4 时 ，S[4] 关 T[4]， 由 next[j] 的 指示 还 需 进行 i=4、 
j=3，i=4、j=2，i=4、j=1 这 3 次 比较 。 实 际 上 ， 因 为 模式 中 的 第 1、2、3 个 字符 和 第 4 个 
字符 都 相等 ， 因 此 不 需要 再 和 主 串 中 的 第 4 个 字符 相 比 较 ， 而 可 以 将 模式 串 向 右 滑动 4 个 
字符 的 位 置 直接 进行 =5、j=1 时 的 字符 比较 。 这 就 说 ， 若 按 上 述 定义 得 到 nextval[k]=k ， 
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而 模式 串 中 pi=pk， 换 句 话说， 此 时 的 next[j] 应 和 mext[k] 相同 。 由 此 可 计算 next 函数 的 修 
正 值 nextval 。 图 5.8 为 上 述 模式 串 的 next 函数 值 和 nextval 函数 值 。 
这 人 





模块 |a a a ab 


nextlj] |0 1 2 3 4 
nextvallj] |0 0 0 0 4 


图 5.8 模式 串 的 next 函数 值 和 nextval 函数 值 


改进 后 求 next 值 的 代码 见 算法 5.26， 其 中 T[0] 表 示 串 T 的 长 度 。 
算法 5.26 ”模式 匹配 的 KMP 改进 算法 








5.3 多 维 数 组 


5.3.1 多 维 数组 的 类 型 定义 


数组 是 由 n(n>1) 个 相同 类 型 的 数据 元 素 ao，a，…，ai，…，arl 构成 的 有 限 序列 。n 
是 数组 的 长 度 。 其 中 ， 数 组 中 的 数据 元 素 a 是 一 个 数据 结构 ， 它 可 以 是 整 型 、 实 型 等 简单 
数据 类 型 ， 也 可 以 是 数组 、 结 构 体 、 指 针 等 构造 类 型 。 根 据 数 组 元 素 a 的 组 织 形式 不 同 ， 


数组 可 以 分 为 一 维 数组 、 二 维 数组 以 及 多 维 (n 维 ) 数 组 。 
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一 维 数组 可 以 看 作 一 个 线性 表 或 一 个 向 量 ， 它 在 计算 机 内 存放 在 一 块 连续 的 存储 单元 
中 ， 适 于 随机 查找 。 一 维 数组 记 为 A[n] 或 A=(a0,al,…,ai,…,an-1)。 

在 一 维 数组 中 ， 一 旦 ao 的 存储 地 址 、 单 个 数据 元 素 所 占 存储 单元 数 k 确定 ， 则 ai 的 存 
储 地 址 Loc(ai) 就 可 求 出 : 





Loc(ai)=Loc(ao)+ixk (0<i<n) (5.8) 
2. 二 维 数 组 


二 维 数组 中 的 每 一 个 元 素 又 是 一 个 定 长 的 线性 表 (一 维 数 组 )， 都 要 受到 两 个 关系 即行 
关系 和 列 关系 的 约束 ， 也 就 是 每 个 元 素 都 同属 于 两 个 线性 表 。 例 如, 设 A 是 一 个 有 m 行 n 
列 的 三 维 数组 ， 则 A 可 以 表示 为 . 





ao ao ”aon < 
Be| 
= 
am-10 am jan-ln-l 


图 5.9 mm 行列 的 二 维 数组 


图 5.9 所 示 的 二 维 数组 可 以 看 成 二 二 厅 行 向 量 组 成 的 向 量 ， 也 可 以 看 由 mn 个 列 向 量 组 
成 的 向 量 。 数 组 中 的 每 个 元 素 由 元 素 值 ai 及 一 组 下 标 ( 了 来 确定 。 ai 既 属于 第 i 行 的 行 向 
量 ， 又 属于 第 j 列 的 列 向 量 = 

显然 ， 二 维 数组 同样 满足 数组 的 定义 。 一 个 各 和 可 以 硬 作 入 个 数 所 元素 部 是 相同 
类 型 的 一 维 数组 。 

3， 多维 数组 1， 

na 维 数 组 是 市 工 [, 个 元 素 组 成 的 ， 所 有 元 素 都 届 于 同一 数据 类 型 ， 每 个 元 素 受 着 n 
个 关系 的 约束 ， 每 个 元 素 aiij (0 大 ij 科 bi) 都 对 应 一 组 下 标 (jo,j…j)。 图 5.10 所 示 


为 三 维 数组 的 逻辑 结构 。 














5.10 一 个 3x4x2 的 三 维 数组 的 逻辑 结构 
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5.3.2 多维 数 组 的 顺序 存储 表示 
数组 一 般 不 作 删 除 或 插入 运算 ， 所 以 一 旦 数组 被 定义 后 ， 数 组 中 的 元 素 个 数 和 元 素 之 
间 的 关系 就 不 再 变动 。 通 常 采 用 顺序 存储 结构 表示 数组 。 
对 于 一 维 数组 ， 数 组 的 存储 结构 关系 如 式 (5.9) 所 示 。 
Loc(ai)=Loc(ao)+ixd(0<i<n) (5.9) 
对 于 二 维 数组 ， 由 于 计算 机 的 存储 单元 是 一 维 线性 结构 ， 如 何 用 线性 的 存储 结构 存放 
二 维 数 组 元 素 就 有 行 、 列 次 序 问题 。 常 用 两 种 存储 方法 : 以 行 序 为 主 序 (row major order) 
的 存储 方式 和 以 列 序 为 主 序 (column major order) 的 存储 方式 ， 也 称 行 优先 顺序 和 列 优 先 顺 
序 。 图 5.11(b) 和 图 5.11(c) 列 举 了 算 阵 A 的 两 种 存储 方式 。 
人 aol ”] 
alo al al2 
(a) 捧 阵 形式 表 术 


aoo | aol | aoz | alo | a0 | al2 ET aol | all | ao | al2 
(b) 以 行 序 为 主 序 的 存储 方式 “1 (Ce) 以 列 序 为 主 序 的 存储 方式 
图 5.11 三 维 数组 A 的 两 种 存储 方式 




















1， 行 优先 顺序 > 

将 数组 元 素 按 行 排列 ,- 第 计 1 个 行 向 量 紧 接 在 第 1 个 行 向量 后 面 。 以 二 维 数组 为 例 ， 
按 行 优先 顺序 存储 的 线性 序列 为 ao，aol，…， abo-D aio，all，…，aio-D，…，am-_lD0， 
am-Dl，“””， am-DncDe 一 Va : 

在 PascalwC 语言 中 ， 数 组 就 是 按 行 优先 顺序 存储 的 。 对 一 个 以 行 序 为 主 序 的 计算 机 
系统 ， 当 二 维 数组 第 一 个 数据 元 素 ao 的 存储 地 址 Loc(aoo) 及 每 个 数据 元 素 所 占用 的 存储 单 
元 d 确定 后 ， 该 二 维 数组 中 任 一 数据 元 素 ai 的 存储 地 址 可 由 式 (5.10) 确 定 : 

Loc(aii)=Loc(aoo)+(ixn+j)xd (5.10) 
其 中 ，n 为 每 行 中 的 元 素 个 数 ( 即 列 数 )。 























同 理 ， 对 于 三 维 数组 Amnp 来 说 ， 数 组 元 素 aik 的 存储 地 址 为 
Loc(aix)=Loc(aooo)+(ixnxp+jxp+k)xd (5.11) 
2， 列 优先 顺序 
将 数组 元 素 按 列 向 量 排列 ， 第 j+1 个 列 向 量 紧 接 在 第 j 个 列 向 量 之 后 ，A 的 mxn 个 元 
素 按 列 优先 顺序 存储 的 线性 序列 为 ao，aio，…， atm-100，301，al1，“…，am-D)l1，“”…，aoon-D， 
aln-0， “”， atm-D-D" 


在 Fortran 语言 中 ， 数 组 就 是 按 列 优先 顺序 存储 的 。 
该 二 维 数组 中 任 一 数据 元 素 ai 的 存储 地 址 可 由 式 (5.12) 确 定 : 
Loc(ai)=Loc(aoo)+Oxm+i)xd G1) 














数据 结 攀 与 算法 应 用 实践 教程 第 版 站 了 





同 理 ， 对 于 三 维 数组 Am 来 说 ， 数 组 元 素 aik 的 存储 地 址 为 
Loc (aix)= Loc (aooo)+(kxmxn +jxm+i)xd (5.13) 


以 上 规则 可 以 推广 到 多 维 数组 的 情况 : 行 优先 顺序 可 规定 为 先 排 最 右 的 下 标 ， 从 右 到 
左 ， 最 后 排 最 左下 标 : 列 优先 顺序 与 此 相反 ， 先 排 最 左下 标 ， 从 左 向 右 ， 最 后 排 最 右 下 标 。 

按 上 述 两 种 方式 顺序 存储 的 数组 ， 只 要 知道 开始 结 点 的 存放 地 址 ( 即 基地 址 )、 维 数 和 
每 维 的 上 、 下 界 ， 以 及 每 个 数组 元 素 所 占用 的 单元 数 ， 就 可 以 将 数组 元 素 的 存放 地 址 表示 
为 其 下 标的 线性 函数 。 因 此 ， 数 组 中 的 任 一 元 素 可 以 在 相同 的 时 间 内 存 取 ， 即 顺序 存储 的 
数组 是 一 个 随机 存 取 结 构 


5.4 ”特殊 矩阵 的 压缩 存储 


矩阵 是 多 科学 与 计算 问题 中 研究 的 数学 对 象 。 在 此 ， 我 们 感 兴趣 的 不 是 矩阵 本 身 ， 而 
是 如 何 存储 矩阵 的 元 ， 从 而 使 矩阵 的 各 种 运算 能 有 效 地 进行 3、 

通常 ， 用 高 级 语言 编制 程序 时 ， 均 用 二 维 数 组 来 存储 逢 阵 元 有 的 程序 设计 语言 中 还 
提供 了 各 种 矩阵 运算 ， 用 户 使 用 时 都 很 方便 。 、 

然而 ， 在 数值 分 析 中 经 常 出 现 一 些 阶 数 很 高 的 年 阵 ， 同 时 在 矩阵 中 有 许多 值 相同 的 元 
素 或 者 零 元 素 。 有 时 为 了 节省 存储 空间 ,, 可 以 对 这 类 和 矩阵 进行 压缩 存储 。 所 谓 压缩 存储 是 
指 为 多 个 值 相同 的 元 只 分 配 一 个 存储 空间 ， 对 零 元 不 分 配 空间 。 

假若 值 相同 的 元 素 或 者 零 元 素 在 矩阵 中 的 分 布 有 一 定 规律 ， 则 我 们 称 此 类 矩阵 为 特殊 
矩阵， 反之 ， 称 为 稀疏 矩阵 *- 下 面 分 别 讨论 它们 的 压缩 存储 一 

特殊 矩阵 压缩 存储 的 方法 是 只 存储 特殊 矩阵 中 数值 不 相同 的 数据 元 素 。 读 取 被 压缩 掉 
和 矩阵 元 素 的 方法 是 利用 矩阵 中 元 素 位 置 与 压缩 存储 后 的 存储 位 置 之 间 的 映射 关系 ， 实 现 条 
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阵 元 素 的 随机 存 取 *- 
5.4.1 对称 矩 阵 
对 称 和 矩阵 是 一 个 n 阶 方 阵 。 若 一 个 n 阶 方 阵 A 中 的 元 素 满足 : 
ai=ai(0<i, j<n-1) (5.14) 
则 称 A 为 n 阶 对 称 和 矩阵 ， 如 图 5.12(a) 所 示 。 
信芳 aoo 
5 0 .800 ali0 all 
189256 ao al an 
30251 
6 1 3 an-10 ao-1,1 An-l,2 an-l,n-l 
(a) 对 称 短 阵 A (b) A 的 下 三 角 元 类 
01234567891011121314 
1[5[o[1Ts[9[31o1215[7[o16[113 
(c)A 的 诺 缩 存储 


图 5.12 对称 和 矩阵 A 及 其 存储 
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在 图 5.10(b) 的 下 三 角 部 分 中 ， 第 i 行 恰 有 计 1 个 元 素 ， 则 元 素 总 数 为 














nl 
> G+D=nan+D/12 (5.15) 
i=0 














于 对 称 和 矩阵 中 的 元 素 关 于 主 对 角 线 对 称 ， 因 此 可 以 为 每 一 对 对 称 的 矩阵 元 素 分 配 1 
个 存储 空间 ，n 阶 和 矩阵 中 的 nxn 个 元 素 就 可 以 被 压缩 到 n(n+1)/2 个 元 素 的 存储 空间 中 。 
腿 设 以 一 维 数 组 sa[n(n+1)/2] 作 为 n 阶 对 称 矩 阵 A 的 压缩 存储 结构 ， 则 其 压缩 存储 结构 
见 表 5-1。 























表 5-1 ”对称 矩阵 的 压缩 存储 结构 


CTE TI TI TY Te To 
| | | 的 | 二] | 二 | we 二 | ws 





为 了 便于 访问 对 称 和 矩阵 A 中 的 元 素 ， 我 们 必须 在 数组 元 素 sa[k] 和 矩阵 元 素 ai 之 间 找 
到 一 个 对 应 关系 。 对 于 下 三 角 中 的 元 素 a#， 其 特点 是 :ri 且 0<i<n-1， 存 储 到 sa 数组 
中 后 ， 由 图 5.12(b), 根据 存储 原则 可 知 ，ai 前 面 有 j 行 ,共有 1+2+3+…+i=i(i+1)/2 个 元 素 ， 
而 ai 又 是 它 所 在 的 行 中 的 第 j 个 ,所 以 在 上 面 的 排列 顺序 中 ，ai 是 第 ii+D/2+j 个 元 素 。 若 
i<j， 则 ai 是 上 三 角 中 的 元 素 ， 因 为 ai=aii' 这 样 ， 访 问 上 三 角 中 的 元 素 ai 时 去 访问 和 它 对 
应 的 下 三 角 中 的 ai 即 可 ， 将 式 iitl)02 忆 中 的 行列 下 标 交 换 就 可 以 了 。 数 组 元 素 sa[k] 和 算 
阵 元 素 ai 之 间 的 对 应 关系 为 } 























人 让 (5.16) 
jj+1)/24i, “i<j 

对 于 任意 给 定 的 二 组 下 标 (ij)， 均 可 在 sa[k] 中 找到 矩阵 元 素 ai， 反 之 ， 对 所 有 的 k=0， 
1,…,n(n+1)/2~1; 都 能 确定 sa[k] 中 的 元 素 在 秆 阵 中 的 位 置 (ij)。 这 种 存储 方式 可 节约 n(n-1)/2 
个 存储 单元 。ri 较 大 时 ， 这 是 可 观 的 一 部 分 存储 资源 。 


5.4.2 ”三角 和 矩阵 


三 角 和 矩阵 也 是 一 个 n 阶 方 阵 ， 有 上 三 角 和 矩阵 和 下 三 角 和 矩阵 。 下 (上 ) 三 角 算 阵 是 主 对 角 
线 以 上 (下 ) 元 素 均 为 常数 或 零 的 n 阶 和 矩阵， 如 图 5.13 所 示 。 下 面 以 一 维 数组 sb[n(n+1)/2+1] 
作为 n 阶 三 角 和 矩阵 B 的 存储 结构 ， 仍 采用 按 行 存储 方案 ， 讨 论 它们 的 压缩 存储 方法 。 





aoo c c 5c C ao aol ao … aon-l 
ao al © © ¢ © Ml Bg mm Ms 
az al a CC c C CC az -… An 
C C C C 
an-10 an an-l2 … an-ln-l C c c CS an-ln-l 
(a) 下 三 角 和 矩阵 (b) 上 三 角 和 矩阵 


图 5.13 ”三角 和 矩阵 示例 
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1. 下 三 角 珑 阵 

下 三 角 和 矩阵 与 对 称 矩 阵 的 压缩 存储 类 似 ， 不 同 之 处 在 于 存储 完 下 三 角 中 的 元 素 以 后 ， 
紧 接着 存储 对 角 线 上 方 的 常量 ， 因 为 是 同一 个 常数 ， 只 需 存 储 一 个 即 可 。 数 组 下 标 与 元 素 
之 间 的 对 应 关系 及 存储 结构 见 表 5-2， 设 存 入 数组 sb[n(n+1)/2+1] 中 ， 这 种 存储 方式 可 节约 
n(n-1)/2-1 个 存储 单元 。 








| i 宇 j (17) 


[n(n+D/2, i<j 


表 5-2 下 三 角 和 矩阵 的 压缩 存储 


TT EE TY Te 
TY EY EY EY CT i 


2， 上 三 角 矩 阵 
对 于 上 三 角 矩 阵 ， 第 一 行 存储 nm 个 元 素 ， 第 二 行 存 储 区 1 个 元 素 ， 以 此 类 推 ，aii 的 前 
面 有 i 行 ， 共 存储 nt-D+ …+(n-(Gi-D)=i(2n-i1J12 个 元 素 ， 而 ai 又 是 它 所 在 行 中 要 存储 
的 第 j-itl 个 元 素 ， 因 此 它 是 上 三 角 存储 顺序 中 的 第 i(2n-i+1)/2+0j-i+1) 个 元 素 ， 在 数组 sb 

中 的 下 标 为 k=i(2n-i+1)/2+j-i， 见 表 5-3。 
pa i<j 





in D) /2, iki CD 


表 5-3 上 三 角 和 矩阵 的 压缩 存储 


Tk | ode | norD2 
sb er [| 
5.4.3 ”对 角 和 矩阵 
对 角 矩 阵 (或 称 带 状 矩阵 ) 是 指 所 有 的 非 零 元 素 都 集中 在 以 主 对 角 线 为 中 心 的 带 状 区 域 
中 ， 即 除了 主 对 角 线 上 和 紧 靠 着 主 对 角 线 上 下 方 若干 条 对 角 线 上 的 元 素 外 ， 所 有 其 他 元 素 
皆 为 零 的 矩阵 。 常 见 的 有 三 对 角 和 矩阵、 五 对 角 答 阵 、 七 对 角 抵 阵 等 。 我 们 主要 讨论 三 对 角 
和 矩阵。 图 5.14 是 一 个 7 阶 三 对 角 和 矩阵 。 
am ao 0 0 0 
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0 al az as 0 0 
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图 5.14 7 阶 三 对 角 和 矩阵 
对 于 n 阶 有 k(k 必 为 奇数 ,因为 副 对 角 线 关 于 主 对 角 线 对 称 ) 条 非 零 元 素 带 的 对 角 和 矩阵 ， 
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只 需 存放 对 角 区 域内 的 所 有 非 零 元 素 即 可 。 
在 n 阶 对 角 矩 阵 A 中 ， 主 对 角 线 元 素数 最 多 n 个 ， 然 后 向 两 边 依次 减少 ， 每 隔 一 条 元 
素 带 元 素数 就 减少 1 个 ， 最 外 端的 对 角 线 有 n-(k-1)/2 个 元 素 ， 所 以 非 零 元 素 总 数 S 为 


nl 


S=n+2 > i 


i=n-(k-D/2 
=n+2(((n—D)+(n-(k-D)/2)/2x(n-D-(n-(k-D)/2)+1) (5.19) 
=n+2(n—(k+D)/4)(k-D)/2 
=kn—(k’—1)/4 


对 角 和 矩阵 可 按 行 优先 顺序 或 对 角 线 的 顺序 ， 将 其 压缩 存储 到 一 个 向 量 中 ， 并 且 也 能 找 
到 每 个 非 零 元 素 和 向 量 下 标的 对 应 关系 。 

以 三 对 角 和 矩阵 为 例 ， 我 们 以 行 序 为 主 序 来 存储 。 除 第 0 行 和 第 n-1 行 是 2 个 元 素 外 ， 
每 行 的 非 零 元 素 都 是 3 个 ， 因 此 ， 需 存储 的 元 素 个 数 为 2+2+3(n-2)=3n-2。 

数组 sc 中 的 元 素 sc[k] 与 三 对 角 和 矩阵 中 的 元 素 ai 存在 一 一 对 应 关系 , 在 gj 之 前 有 i 行 ， 
共有 2+3x(i-1)=3i-1 个 非 零 元 素 ， 在 第 i 行 ， 有 jit 下 个 非 零 元 素 ， 这 样 ， 非 零 元 素 ai 在 
数组 sc 中 的 下 标 为 k=3i-1+j-it1=2itj， 见 表 5-4s - 

表 5-4 三 对 角 矩 阵 的 存储 结构 
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上 述 的 各 种 特殊 矩阵 ,- 其 非 零 元 素 的 分 布 都 是 有 规律 的 ， 因 此 总 能 找到 一 种 方法 将 它 
们 压缩 存储 到 一 个 向 量 中 ,并且 一 般 都 能 找到 甜 阵 中 的 元 素 与 该 向 量 的 对 应 关系 ， 通 过 这 
个 关系 ， 仍 能 对 矩阵 的 元 素 进行 随机 存 取 s 


5.5 稀 琉 矩阵 


如 果 一 个 矩阵 中 有 很 多 元 素 的 值 为 零 ， 即 零 元 素 的 个 数 远 远大 于 非 零 元 素 的 个 数 时 ， 
称 该 矩阵 为 稀疏 和 矩阵。 稀疏 矩阵 一 般 都 采用 压缩 存储 的 方法 来 存储 矩阵 中 的 元 素 。 一 般 在 
这 类 矩阵 中 ， 非 零 元 素 的 分 布 没有 规律 ， 为 了 能 找到 相应 的 元 素 ， 仅 存储 非 零 元 素 的 值 是 
不 够 的 ， 还 要 记 下 它 所 在 的 行 和 列 。 有 两 种 常用 的 存储 稀疏 矩阵 的 方法 : 三 元 组 表示 法 
和 十 字 链 表 法 。 


























t 


mxn 


假设 在 mxn 的 矩阵 中 ， 有 个 元 素 不 为 零 。 令 6= 


， 称 8 为 矩阵 的 稀疏 因子 。 
通常 认为 5 三 0.05 为 稀疏 矩阵 。 





5.5.1 ”稀疏 矩阵 的 三 元 组 表示 法 
三 元 组 表示 法 就 是 在 存储 非 零 元 素 的 同时 ， 也 存储 该 元 素 所 对 应 的 行 下 标 和 列 下 标 。 


9 lio 
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稀 玻 矩阵 中 的 每 一 个 非 零 元 素 由 一 个 三 元 组 (ij, ai) 唯 一 确定 。 和 矩阵 中 所 有 非 零 元 素 存放 在 
由 三 元 组 组 成 的 数组 中 ， 该 数组 的 第 0 位 未 用 。 

假设 有 一 个 6x7 阶 稀疏 矩阵 A, 其 元 素 情况 及 非 零 元 素 对 应 的 三 元 组 表 (以 行 序 为 主 序 ) 
如 图 5.15 所 示 。 
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图 5.15 ”稀疏 矩阵 及 三 元 组 表 


假设 以 行 序 为 主 序 ， 目 以 一 维 才 组 作为 三 元 组 表 的 存储 结构 时 然 ， 要 唯一 地 表示 一 
个 稀 琉 矩阵 ， 还 需要 在 存储 三 元 组 表 的 同时 存储 该 矩阵 机 为 了 运算 方便 ， 和 矩阵 的 
非 零 元 素 的 个 数 也 同时 存储 。 三 元 组 顺序 表 的 数据 : 算法 5.27。 
算法 5.27 稀疏 和 矩阵 的 建立 N 







的 和 矩阵 B， 且 满足 ai=bi， 即 a[i][]=b0]。 其 中 ， 


(5 ) 第 5 章 ， 囊 、 多 维 数 组 与 特殊 拓 了 
se 一 
(9 一 一 人 
// 行 或 列 的 顺序 有 错 
{ 
printf(" 行 或 列 的 顺序 有 错 ， 请 重新 输入 \n"); exit(0); 
| 
M.data[il] .i=m; 
M.data[lil] .j=n; 
M.data[il] .e=e; 
return OK; 
站 
下 面 讨论 这 种 存储 方式 Be rt ee 
转 置 是 矩阵 中 最 简单 的 一 种 运算 。 对 于 一 个 mxn 的 矩阵 A， 其 转 置 矩阵 是 一 个 nxm 


1<i<m, 1<j<n, 即 A 机 的 列 ， 


A 的 列 是 B 的 行 。 
三 元 组 表示 的 稀 玖 矩阵 转 置 的 常 














算法 有 以 下 两 种 。 


单 地 交换 a.data 中 i 和 j 的 内 容 , 那么 得 到 的 ,bdata 将 是 
B， 要 得 到 按 行 优先 顺序 存储 的 b.data, “就 必须 重新 排列 = 


b.data 必定 上 


尾 扫描 
依次 放 入 b.data 中 ， 


则 算法 
乘积 成 





1， 列 序 转 置 
将 A 转 置 为 B， 就 是 将 A 的 三 元 组 表 a.data 置换 为 B 的 三 元 组 表 b.data， 如 果 只 是 简 





-个 按 列 优先 顺序 存储 的 稀 政 矩阵 
:元 组 的 顺序 。 

B 的 行 , 因此 ,, 按 aidata 的 列 序 转 置 ,所 得 到 的 转 置 窍 阵 B 的 三 
CL 先 存放 的 。 


由 于 A 的 列 是 元 组 表 






按 这 种 方法 设计 的 算法 ,其 基本 思想 是 对 A 中 的 每 一 列 col(1<col<n)， 通 过 从 头 至 
:元 组 表 a.data， 找 出 所 有 列 号 等 于 col 的 那些 三 元 组 , 将 它们 的 行 号 和 列 号 互 换 后 





即 可 得 到 B 的 按 行 优先 的 压缩 存储 表示 ， 见 算法 5. 
算法 5.28、/ 稀 玻 矩 阵 的 列 序 转 置 


int transposematrix(TSMatrix a, TSMatrix b){ 





int col, totalN,k=1; 

if(a.tu==0) return(0); // 和 矩阵 中 无 非 零 元 素 

b.nu=a.mu; // 转 置 矩 阵 B 的 列 数 为 矩阵 A 的 行 数 

b.mu=a.nu; // 转 置 矩 阵 B 的 行 数 为 矩阵 A 的 列 数 

b.tu=a.tu; // 转 置 矩 阵 B 中 非 零 元 素 个 数 为 矩阵 A 中 非 零 元 素 个 数 
for(col=1;col<=a.nu;col++)  // 按 矩阵 A 的 列 序 扫描 


for(totalN=1;totalN<=a.tu;totalN++) 
if(a.data[totalN] .j==col){ // 判 断 第 j 个 三 元 组 是 不 是 第 i 列 的 

b.data[lk] .i=a.data[ltotalN] .jb.data[k].j=a.data[totalN] .i; 

b.data[k] .e=a.data[totalN] .e; 

+ 十 7 
return(OK); // 成 功 完成 矩阵 转 置 
} 
以 上 算法 的 时 间 主 要 花费 在 两 个 循环 上 ， 假 设 和 矩阵 A 为 m 行 n 列 ， 有 t 个 非 零 元 素 ， 
I 时间 复杂 度 为 Omxt)。 也 就 是 说 ， 时 间 的 花费 和 和 矩阵 A 的 列 数 和 非 零 元 素 个 数 的 


: 比 。 若 用 mxn 的 二 维 数组 表示 算 了 泗 ， 则 相应 的 矩阵 转 置 算法 的 循环 为 
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for(i=1; i<=n; I++) 
for(j=1; j<=m; j++) 
bl[lil] [jl]=a[j] [il]; 


此 时 ， 时 间 复 杂 度 为 O(mxn) 。 三 元 组 顺序 表 虽 然 节省 了 存储 空间 ， 但 时 间 复 杂 度 比 
- 般 矩 阵 转 置 算法 的 要 大 些 ,同时 还 有 可 能 增加 算法 的 难度 因此, 此 算法 仅 适 用 于 t<<mxn 
的 情况 。 

2， 快速 转 置 


如 果 能 预先 确定 矩阵 A 中 每 一 列 (B 的 每 一 行 ) 的 第 一 个 非 零 元 素 在 b.data 中 应 有 的 位 
置 ， 那 么 在 对 a.data 中 的 三 元 组 依次 作 转 置 时 ， 便 可 直接 放 到 b.data 中 恰当 的 位 置 上 去 。 

为 了 确定 这 些 位 置 ， 在 转 置 前 应 先 求 得 矩阵 A 中 的 每 一 列 中 非 零 元 素 的 个 数 。 因 为 矩 
阵 A 中 某 一 列 的 第 一 个 非 零 元 素 在 数组 b.data 中 应 有 的 位 置 等 于 前 二 列 第 一 个 非 零 元 素 的 
位 置 加 上 前 列 非 零 元 素 的 个 数 ， 为 此 ， 需 要 设置 两 个 一 维 数组 num[col] 和 cpos[col] 。 

(1) num[col]: 统计 A 中 每 列 非 零 元 素 的 个 数 。 

(2) cpos[col]: A 中 的 每 列 第 一 个 非 零 元 素 在 gdata 中 的 位 置 。 









































显然 ， 有 
1|=1, 1=1 
cpos[1] co Ga0 
cpos[col] = cpos[col 1] num[col 3 1], 2<colanum 
对 于 图 5.13 所 示 的 稀 玻 矩阵 来 说 ”num[coDl 和 cpos[coHj 的 值 见 表 5-5。 
表 5-5 和 矩阵 A 的 num[col 和 cpos[col] 值 
col 人 
numlcol] 1 
cpos[col] 6 
这 种 转 置 方法 称 为 快速 转 置 ， 其 代码 实现 见 算法 5.29。 
算法 5.29 稀疏 矩阵 的 快速 转 置 
void fasttranstri(TSMatrix a, TSMatrix &b){ 
int p,q,col,k,num[la.nu],cpos[a.nu]; 
if(a.tu==0) return(0); // 和 矩阵 中 无 非 零 元 素 
b.nu=a.mu; // 转 置 矩阵 B 的 列 数 为 矩阵 A 的 行 数 
b.mu=a.nu; // 转 轿 和 矩阵 B 的 行 数 为 矩阵 A 的 列 数 
b.tu=a.tu; // 转 置 矩 阵 B 中 的 非 零 元 素 个 数 为 矩阵 A 中 非 零 元 素 个 数 
if(b.tu){ 
for(col=1;col<=a.nu; col++) num[col]=0; 
for(k=1; k<=a.tu; k++) // 求 A 中 每 一 列 含 非 零 元 素 的 个 数 
++num[a.data[k] .j]; 
cpos[1]=1; //A 中 第 一 列 非 零 元 素 在 b.data 中 的 序号 


for(col=2;col<=a.nu; col++) // 求 A 中 各 列 第 一 个 非 零 元 素 在 b.data 中 的 位 置 


cpos[col]=cpos[col-1]+num[col-1]; 


be 多 维 数 组 与 特殊 失 隆 
O 一 本 


for(p=1;p<=a.tu; p++){ 
col=a.data[p] .j; 
q=cpos[col]; 
b.data[q] .i=a.data[p] .j; 
b.data[q] .j=a.data[p] .i; 
b.data[q] .e=a.data[p] .e; 
++cpos[col]; 





} 
设 和 A 和 矩阵 有 n 列 t 个 非 零 元 素 , 则 循环 次 数 为 ntt+ntt， 故 时 间 复 杂 度 为 O(n+t)。 当 甜 
阵 中 大 约 有 mxn 个 非 零 元 素 时 ， 时 间 复杂 度 为 O(mxn)， 与 经 典 算法 的 时 间 复杂 度 相同 。2 
个 数组 占用 ntn 个 存储 单元 ， 空 间 复杂 度 为 O(n)。 ) 
5.5.2” 稀 玻 矩阵 的 十 字 链 表 法 AN 
稀 琉 矩阵 中 非 零 元 素 的 位 置 或 个 数 经 常 变动 时 ，， 三 元 组 就 不 适 于 作为 稀 葡 矩阵 的 存储 
结构 ， 此 时 ， 采 用 链表 作为 存储 结构 更 为 恰当 # 
对 于 一 个 mxn 的 稀 玻 矩阵 ， 每 个 非 零 元 素 用 一 个 含有 5 个 域 的 结 点 来 表示 ， 如 图 5.16 
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5.16 ” 稀 玻 矩阵 结 点 表示 


其 中 各 分 量 含义 如 下 : 

(Di 表示 矩阵 中 非 零 元 素 的 行 号 。 

(2)j 表示 矩阵 中 非 零 元 素 的 列 号 。 

(3) value 表示 矩阵 中 非 零 元 素 的 值 。 

(4) right 表示 向 右 域 ， 用 以 链接 同一 行 中 下 一 个 非 零 元 素 。 

(5) down 表示 向 下 域 ， 用 以 链接 同一 列 中 下 一 个 非 零 元 素 。 

同一 行 的 非 零 元 素 通过 right 域 链接 成 一 个 链表 ， 同 一列 的 非 零 元 素 通过 down 域 链接 
成 一 个 链表 ， 每 一 个 非 零 元 素 既 是 某 个 行 链 表 中 的 结 点 ， 又 是 某 个 列 链表 中 的 结 点 。 每 个 
非 零 元 素 就 好 像 站 在 十 字 路 口 一 样 , 由 此 称 为 十 字 链 表 。 图 5.17 所 示 是 一 个 稀 朴 矩阵 A 的 
十 字 链 表 M。 

十 字 链 表 M 为 稀疏 矩阵 的 每 一 个 行 设 置 一 个 单独 链表 , 同时 也 为 每 一 列 设 置 一 个 单独 
链表 ， 这 样 稀 朴 矩阵 的 每 个 非 零 元 素 就 同时 包含 在 两 个 链表 中 ， 即 每 一 个 非 零 元 素 同时 包 
含 在 所 在 行 的 行 链表 中 和 所 在 列 的 列 链 表 中 ， 这 就 大 大 降低 了 链表 的 长 度 ， 方 便 了 算法 中 
行 方向 和 列 方向 的 搜索 ， 因 而 大 大 降低 了 算法 的 时 间 复 杂 度 。 
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图 5.17 A M 表示 的 稀 瑚 短 阵 人 


十 字 链 表 的 创建 见 算法 5.30, 
算法 5.30 十 字 链 表 的 建立 





meng 


S 》 第 5 章 ， 串 、 多 维 数组 与 特殊 矩阵 
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在 行 表 和 列表 中 的 插入 位 置 ， 





对 于 凸 行 n 列 且 有 t 个 非 零 元 素 的 稀 玻 矩阵 , 算法 5.30 的 执行 时 间 为 O(txs) ,s=max{m, 
n}， 这 是 因为 每 建立 一 个 非 零 元 素 的 结 点 都 要 寻 查 它 


此 算法 


对 非 零 元 素 输入 的 先后 次 序 没有 任何 要 求 。 反 之 ， 若 按 以 行 序 为 主 序 的 次 序 依次 输入 三 元 
组 ， 则 可 将 建立 十 字 链 表 的 算法 改写 成 O(t) 数量 级 。 


5.6 应 用 


5.6.1 ” 汉 诺 塔 问题 


回头 巡回 汉 诺 塔 (hanoi 塔 ， 又 称 河 内 塔 ) 问 题 其 
多 的 神 勃 拉 玛 在 一 个 庙 里 留 下 了 3 根 金刚 石 
加 最 大 的 一 个 在 底下 ， 其 余 一 个 比 一 下 
【参考 图 文 】 一 个 个 地 从 这 根 棒 搬 到 另 一 根 棒 上 ， 


实 是 印度 的 一 个 古老 的 传说 。 开 天 有 辟 地 





| 


的 棒 ， 第 一 根 上 面 套 着 64 个 





的 金 片 ， 











依次 和 琶 上 去 证 里 的 众 僧 不 倦 
定 可 利用 中 间 的 一 根 棒 作 为 辅助 ， 


也 把 它们 


但 每 次 


只 能 搬 一 个 ， 而 且 大 的 不 能 放 在 小 的 上 面 。 让 作风 pe sl 约 为 


18446744073709551615， 众 僧 们 即便 耗 尽 毕生 精力 
为 了 实现 汉 诺 塔 问题 ， 我 们 可 以 描述 如 下 : 


有 A、B、C 三 个 杆 ， 如 图 5.18 所 示 。 和 态 标 上 有 若干 个 F 
小 的 在 上 面 ，B 和 C 都 是 空 杆 ， 把 A- 杆 出 的 圆 盘 都 倒 到 B 村 或 C 杆 上 ， 


不 可 以 使 大 的 圆 盘 压 在 小 的 圆 盘 上 , 并且 一 次 只 能 


让,| 


也 不 可 能 完成 金 片 的 移动 。 





移动 一 个 圆 盘 。 


C 


图 5.18 3 阶 汉 诺 塔 问题 的 初始 状态 
分 析 : 若 只 有 一 个 圆 盘 ， 则 直接 从 A 杆 移 到 C 杆 。 若 有 一 个 以 上 的 圆 盘 ， 假设 有 n 








个 ， 则 考虑 3 个 步骤 。 














1 大 到 小 的 圆 盘 ， 大 的 在 下 面 ， 
在 倒 盘 的 过 程 中 


第 一 步 ， 把 n-1 个 圆 盘 从 A 杆 搬 到 B 杆 (辅助 杆 )， 这 不 是 一 起 搬 动 ， 而 是 按 要 求 从 一 





人 另 一 个 杆 。 





























第 三 























解 : 求解 n 阶 汉 诺 塔 问题 的 代码 如 下 : 


#include <stdio.h> 


void Move(int n,char A,char B) 


{ 


， 用 第 一 步 所 说 的 办 法 再 将 B 杆 上 的 圆 盘 都 搬 到 C 杆 上 。 和 第 一 
实际 上 是 由 一 个 序列 更 小 的 一 次 仅 搬 一 个 盘 的 操作 组 成 。 


二 步 ， 将 剩 下 的 一 个 圆 盘 从 A 杆 移 到 空 着 的 C 杆 上 。 





// 把 n 号 圆 盘 从 x 移 到 y， 并 : 


printf("Move disk %d from %c to scNn"，n， A, B); 


步 一 样 ， 这 步 


输出 
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显然 ， 上 述 代 码 中 求解 汉 诺 塔 问 多 肖 开 是 一 个 地 归 西 数 ， 在 函数 执行 过 程 中 需要 多 
次 自我 调用 。 ee 数 调用 没有 区 别 归 调用 时 ， 函 数 调用 一 次 就 
被 压 一 次 栈 ， 但 调用 不 能 无 限 进行 以 得 有 一 个 结束 条 件 ， 这 时 return 并 不 意味 着 整个 
函数 退出 了 ， en ye 然后 一 层 层 
返回 。 


5.6.2 a 内 

假设 以 定 长 顺序 存储 结构 表示 串 ， 设 流 计 -让 效法 求 串 s 中 出 现 的 第 一 个 最 长 重复 字 
串 及 其 位 置 ， 并 分 析 该 算法 的 时 间 复 杂 度 。 

分 析 : 该 算法 思想 是 ， 依 次 把 串 s 的 一 个 副本 s2 向 右 错位 平移 1 格 、2 格 、3 格 …… 
与 自身 sl 相 匹配 ， 如 果 存在 最 长 重复 子 串 ， 则 必然 在 此 过 程 中 被 发 现 。 用 变量 Is1、lrs2、 
maxlen 记录 已 发 现 的 最 长 重复 字 串 第 一 次 出 现 的 位 置 、 第 二 次 出 现 的 位 置 和 长 度 。 题目 中 
未 说 明 “重复 字 串 ”是 否 允 许 有 重 倒 部 分 ， 本 算法 假定 允许 。 如 不 允许 ， 只 需 在 第 二 个 for 
语句 的 循环 条 件 中 加 上 “k<=i” 即 可 。 此 题 可 有 多 种 解法 ， 但 时 间 复 杂 度 不 同 ， 较 好 的 做 
法 能 达到 的 时 间 复 杂 度 为 O(length*(s))。 

解 : 算法 如 下 : 


fp 
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5.6.3 ”稀疏 矩阵 的 相 加 SN 
假设 稀 玻 矩阵 A 和 ne 构 。 试 写 出 两 个 稀 琉 矩阵 相 加 的 算法 。 
解 ， 算 法 如 下 : 
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= py oa 
if(q>MAXSIZE) // 非 零 元 素 个 数 太 多 
printf(" 非 零 元 素 个 数 太 多 请 重新 输入 \n"); 
exit(0); 
’ 


return OK; 


} 
5.6.4 中文 分 词 


分 词 就 是 将 连续 的 字 序 列 按照 一 定 的 规范 重新 组 合成 词 序 列 的 过 程 。 把 中 文 的 汉字 序 
列 切 分 成 有 意义 的 词 ， 就 是 中 文 分 词 ， 也 称 为 切 词 。 中 文 分 词 主要 应 用 于 信息 检索 、 汉 字 
的 智能 和 输入、 中 外 文 对 译 、 中 文 校 对 、 自 动 摘 要 、 自 动 分 类 等 很 多 方面 。 下 面 以 信息 检索 
为 例 来 说 明 中 文 分 词 的 应 用 。 

对 于 搜索 引擎 ， 最 重要 的 并 不 是 找到 所 有 结果 ， 因 为 在 二 百 人 的 网 页 中 找到 所 有 结果 
没有 太 多 意义 ， 没 有 人 能 看 得 完 ， 最 重要 的 是 把 相关 的 结果 排 在 最 前 面 ， 这 也 称 为 相关 度 
排序 。 中 文 分 词 的 准确 与 否 ， 常 常 直接 影响 到 对 搜索 结果 的 相关 度 排 序 。 
基于 字符 串 匹配 的 分 词 方法 又 叫 机 械 分 词 方法 ,， 它 是 按照 一 定 的 策略 将 待 分 析 的 汉字 
串 与 一 个 “充分 大 的 ”机 器 词典 中 的 词 条 进行 匹配 。 若 在 词典 中 找到 某 个 字符 串 则 匹配 成 
功 (识别 出 一 个 词 )。 按 照 扫 描 方 向 的 不 同 ， 串 匹配 分 词 方法 可 以 分 为 正 向 匹配 法 和 逆向 匹 
配 法 ; 按照 不 同 长 度 优先 匹配 的 情况 ， 可 以 分 为 最 大 (最 长 ) 匹 配 法 和 最 小 (最 短 ) 匹 配 法 ; 按 
照 是 否 与 词性 标注 过 程 相 结 合 ; ;又 可 以 分 为 单纯 分 词 方法 和 分 词 与 标注 相 结合 的 一 体 化 方 
法 。 常 见 的 几 种 机 械 分 词 方法 有 以 下 几 种 : 正 向 最 大 匹配 法 (由 左 到 右 的 方向 )、 逆 向 最 大 
匹配 法 (由 右 到 左 的 方向 -最少 切 分 法 (使 每 一 旬 中 切 出 的 词 数 最 小 )。 还 可 以 将 上 述 各 种 方 
法 相互 结合 。 例 如 交 可 以 将 正 向 最 大 匹配 法 和 逆向 最 大 匹配 法 结合 起 来 构成 双向 匹配 法 。 
一 般 来 说 ， 道 向 匹配 的 切 分 精度 略 高 于 正 向 匹配， 遇 到 的 歧义 现象 也 比较 少 。 实 际 使 用 的 
分 词 系统 都 是 把 机 械 分 词 作为 一 种 初 分 手段 ， 还 需 利 用 各 种 其 他 的 语言 信息 来 进一步 提高 
切 分 的 准确 率 。 

一 种 方法 是 改进 扫描 方式 ， 称 为 特征 扫描 或 标志 切 分 ， 优 先 在 待 分 析 字 符 串 中 识别 和 
切 分 出 一 些 带 有 明显 特征 的 词 ， 以 这 些 词 作为 断 点 ， 可 将 原 字符 串 分 为 较 小 的 串 再 来 进行 
机 械 分 词 ， 从 而 减少 匹配 的 错误 率 。 另 一 种 方法 是 将 分 词 和 词类 标注 结合 起 来 ， 利 用 丰富 
的 词类 信息 对 分 词 决策 提供 帮助 ， 并 且 在 标注 过 程 中 反 过 来 对 分 词 结果 进行 检验 、 调 整 ， 
从 而 极 大 地 提高 切 分 的 准确 率 。 

对 于 机 械 分 词 方法 ， 可 以 建立 一 个 自动 分 词 模型 (Automatic Segmentation Model， 
ASM)， 形 式 地 表示 为 ASM(d,a,m)， 其 参数 含义 如 下 。 

(1) d: 匹配 方向 ，+1 表示 正 向 ，-1 表示 逆向 。 

(2) a: 每 次 匹配 失败 后 增加 或 减少 字符 串 长 度 (字符 数 )，+1 表示 增 字 ，-1 表示 减 字 。 

(3) m: 最 大 /最 小 匹配 标志 ，+1 为 最 大 匹配 ，-1 为 最 小 匹配 。 

例如 ，ASM(+,-,+) 就 是 正 向 减 字 最 大 匹配 法 ，ASM(-,-,+) 就 是 逆向 减 字 最 大 匹配 法 。 
对 于 现代 汉语 , 只 有 m=+1 是 实用 的 方法 。 用 这 种 模型 可 以 对 各 种 方法 的 复杂 度 进行 比较 。 
假设 在 词典 的 匹配 过 程 都 使 用 顺序 查找 和 相同 的 计 首 字 索 引 查找 方法 ， 则 在 不 计 首 字 索 引 
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查找 次 数 (最 小 为 汉字 总 数 的 对 数 ， 为 12 一 14) 和 词典 读 入 内 存 时 间 的 情况 下 ， 对 于 典型 的 
词 频 分 布 ， 减 字 匹 配 ASM(d,-,m) 的 复杂 度 约 为 12.3 次 ， 增 字 匹 配 ASM(d,+,m) 的 复杂 度 约 
为 10.6 次 。 
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本 章 介绍 了 串 类 型 的 定义 及 其 实现 方法 ， 并 重点 讨论 了 串 操作 中 最 常用 的 “模式 匹配 
(又 称 子 串 定位 )” 的 两 个 算法 。 

串 的 两 个 显著 特点 是 : @ 它 的 数据 元 素 都 是 字符 ， 因 此 它 的 存储 结构 和 线性 表 有 很 大 

不 同 ， 例 如 ， 多 数 情况 下 ， 实 现 串 类 型 采用 的 是 “ 堆 分 配 ” 的 存储 结构 ， 而 当 用 链表 存储 
串 值 时 ， 结 点 中 数据 域 的 类 型 不 是 “字符 ” 而 是 “ 串 ” 这 种 块 链 结构 通常 只 在 应 用 程序 
中 使 用 ; @ 串 的 基本 操作 通常 以 “ 串 的 整体 ”作为 操作 对 象 ,而 不 像 线 性 表 以 “数据 元 素 ” 
作为 操作 对 象 。 
“ 串 匹 配 ” 的 简单 算法 的 思想 直截了当 ， 简 单 易 懂 7 适用 于 在 一 般 的 文档 编辑 中 应 用 ， 
但 在 某 些 特殊 情况 , 如 只 有 0 和 ! 两 种 字符 构成 的 文本 串 中 应 用 时 效率 很 低 , KMP 算法 是 
它 的 一 种 改进 方法 ， 其 特点 是 利用 匹配 过 程 中 已 经 得 到 的 主 串 和 模式 串 对 应 字符 之 间 “ 等 
与 不 等 ”的 信息 及 T 串 本 身 具 有 的 特性 来 决定 之 后 进行 的 匹配 过 程 ， 从 而 减少 了 简单 算法 
中 进行 的 “本 不 必要 再 进行 的 ”字符 比较 : 

通过 本 章 的 学 习 , 了 解 了 多 维 数组 和 特殊 矩阵 的 类 型 定义 及 其 在 C 语 言 中 的 实现 方法 。 
数组 作为 一 种 数据 类 型 ， 它 的 特点 是 一 种 多 维 的 线性 结构 ,> 并 只 进行 存 取 或 修改 某 个 元 素 
的 值 的 操作 ， 因 此 它 只 需要 采用 顺序 存储 结构 。 研 究 特殊 矩阵 的 压缩 对 解决 我 们 现实 生活 
的 问题 有 比较 重要 的 意义 ,~ 如 图 像 压 缩 方 面 。 


习题 与 思考 




























































































5.1 单 选 题 
1. 设 有 一 个 6 阶 的 对 称 矩 阵 A， 采 用 压缩 存储 方式 ， 以 行 序 为 主 存储 ，au 为 第 一 元 
素 ， 其 存储 地 址 为 1， 每 个 元 素 占 一 个 地 址 空间 ， 则 ass 的 地 址 为 (。””)。 
A. 13 B. 11 G18 D20 
2. 设 有 数组 A[ij]， 数 组 的 每 个 元 素 长 度 为 3 字 节 ，i 的 值 为 1 一 8，j 的 值 为 1 一 9， 
数组 从 内 存 首 地 址 BA 开始 顺序 存放 ， 当 以 列 序 为 主 存放 时 ， 元 素 A[5,6] 的 存储 首 地 址 为 
(  )。 
A. BA+132 B. BA+180 C. BA+222 D. BA+225 
3. 数组 A[0...5,0...6] 的 每 个 元 素 占 5 字 节 ， 将 其 按 列 优先 次 序 存储 在 起 始 地 址 为 1000 
的 内 存单 元 中 ， 则 元 素 A[5,5] 的 地 址 是 (。”)。 
A. 1175 B. 1180 G 1205 D. 1210 
4. 下 面 关于 串 的 叙述 中 ， 不 正确 的 是 ( )。 
A. 串 是 字符 的 有 限 序列 
B. 空 串 即 空白 串 











$f 
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C. 模式 匹配 是 串 的 一 种 重要 运算 
D. 串 既 可 以 采用 顺序 存储 ， 也 可 以 采用 链 式 存储 
5. 若 串 S='abbdded'， 则 其 子 串 的 数目 是 ( 。 )。 
A. 8 B. 28 CG: D7 
5.2 ”填空 题 
1. 设 二 维 数组 A[0...49,1...50]， 每 个 元 素 占有 4 个 存储 单元 ， 存 储 起 始 地 址 为 200。 
如 按 行 优先 顺序 存储 ， 则 元 素 A[25,18] 的 存储 地 址 为 ; 如 按 列 优先 顺序 存储 ， 则 
元 素 A[18,25] 的 存储 地 址 为 
2. 假设 一 个 10 阶 的 上 三 角 矩 阵 A 按 行 优先 顺序 压缩 存储 在 一 维 数组 B 中 , 则 非 零 元 
素 A[9,9] 在 B 中 的 存储 位 置 k=  _。( 注 : 矩阵 元 素 下 标 从 1 开始 。) 
3. 下 列 程序 判断 字符 串 s 是 否 对 称 , 对 称 则 返回 1， Bs 例如 , 对 于 f("abba")， 
返回 1; 对 于 f("abab")， 返 回 0。 ee 














ia XAN、 
4. 下 列 算法 实现 求 采用 顺 条 存储 中 s 和 的 千 个 最 长 公共 子 串 。 
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5. 实现 字符 串 复制 的 函数 strcpy 如 下 : 





void strcpy(char *s , char *t) 
放 

while( ) 
} 





3 思考 题 
串 与 空格 串 的 区 别 是 什么 ? 

是 一 种 特殊 的 线性 表 ， 其 特殊 体现 在 什么 地 方 ? 

的 两 种 基本 存储 方式 是 什么 ? 

个 串 相等 的 充分 必要 条 件 是 什么 ? 

， 设 有 nxn 阶 三 对 角 矩 阵 (ai)， 将 其 3 条 对 角 线 上 的 元 素 逐 行 地 存 于 数组 B(1:3n-2) 

使 得 B[k=ai， 求 : ~ 

(1) 用 i,j 表 示 k 的 下 标 变 换 公式 。 

(2) 用 kk 表示 i 的 下 标 变 化 公式 。 C 

6 数组 A 中 ， 每 个 元 素 A[ij] 的 长 度 均 为 32 个 二 这 位 ， 行 下 标 从 0 到 10， 列 下 标 从 
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1 到 11， 从 首 地 址 S 始 连 续 存放 于 主 存储 器 中 ; - 主 存储 器 字 长 为 16 位 。 求 : 


(1) 存放 该 数组 所 需 多 少 单元 ? 

(2) 存放 数组 第 4 列 所 有 元 素 至 少 需 多 少 单 元 ? 

(3) 数组 按 行 存放 时 ， 元 素 A[7:4] 的 起 始 地 址 是 多 少 ? 

(4) 数组 按 列 存放 时 ， 无 素 A[4.7] 的 起 始 地 址 是 多 少 ?2 属 

7. 已 知 A 为 稀 蓝 和 矩阵 ， 试 从 空间 角度 和 时 间 角 大 比 较 采 用 两 种 不 同 的 存储 结构 (二 维 





数组 和 三 元 组 表 ) 完 成 求 》 ai 运算 的 优 缺点 。 
yi I 


为 t。 


8. 设 对 角 线 矩阵 

0 

0 

0 (行列 下 标 计 满足 1<i, j<5) 
1 

0 0 3 5 


(1) 车 将 矩阵 A 压缩 存储 到 数组 S 中 : 
[i211ofil:T:iololoflsTs] 

下 标 : 1 名 分 宁 沪 阁下 011 授 澡 

试 求 出 A 中 已 存储 元 素 的 行列 下 标 (ij) 与 S 中 元 素 的 下 标 之 间 的 关系 。 

(2) 车 将 A 视 为 稀疏 矩阵 ， 请 画 出 其 行 逻辑 链接 顺序 表 。 

9. 如 果 两 个 串 含有 相等 的 字符 ， 能 否 说 它们 相等 ? 

10. 设 S1、S2 为 串 ， 给 出 使 SIVS2=S2/S1 成 立 的 所 有 可 能 的 条 件 (/ 为 连接 符 )。 

11. 已 知 s=-'(xyz)+#，t=(x+z)*y'， 试 利用 链接 、 求 子囊 和 置换 等 基本 运算 ， 将 s 转化 


只 
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12. 两 个 字符 串 S1 和 S2 的 长 度 分 别 为 m 和 n。 求 这 两 个 字符 串 最 大 共同 子 串 算 法 的 
时 间 复 杂 度 T(m,n)。 估 算 最 优 的 T(m,n)， 并 简要 说 明理 由 。 
13. 函数 void insert(char*s,char*t,int pos) 用 于 将 字符 串 t 插 入 到 字符 串 s 中 ， 插 入 位 置 
为 pos。 试 用 C 语言 实现 该 函数 。 假 设 分 配给 字符 串 s 的 空间 足够 使 字符 串 t 插 入 (说 明 : 


不 得 使 用 任何 库 函 数 )。 
14. S=“S1S2…Sn” 是 一 个 长 为 N 的 字符 串 ， 存 放 在 一 个 数组 中 ， 编 程序 将 S 改造 之 


后 输出 : 

(1) 将 S 的 所 有 第 偶数 个 字符 按照 其 原来 的 下 标 从 大 到 小 的 次 序 放 在 S 的 后 半 部 分 ; 
(2) 将 S 的 所 有 第 奇数 个 字符 按照 其 原来 的 下 标 从 小 到 大 的 次 序 放 在 S 的 前 半 部 分 。 
例如 : S='ABCDEFGHIKL'， 则 改造 后 的 S 为 'ACEGIKLJHFDB'。 
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(1) 领会 树 和 二 又 树 的 类 型 定义 及 主要 特性 。 ¢ < 

(2) 精通 二 又 树 的 各 种 遍历 算法 。 

@) eat SN 
二 ee 
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二 叉 树 和 树 的 遍历 及 其 应 用 是 本 章 的 学 习 重 点 ， 而 编写 实现 二 又 树 和 树 的 各 种 操作 的 
递归 算法 也 恰 是 本 章 的 难点 所 在 。 
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本 章 是 整个 课程 的 第 二 个 学 习 重点 ， 也 是 整个 课程 中 的 一 大 难点 。 在 本 章 的 学 习 过 程 中 ， 
主要 应 该 学 会 如 何 根据 二 又 树 和 树 的 结构 及 其 操作 的 递归 定义 编写 递归 算法 。 


树 是 一 种 常 
若 n=0， 则 称 为 空 树 。 
m(m>0) 个 互 不 相交 的 子 集 Ti，T>， 


回 芭 YX 回 子 树 。 





回访 
【参考 图 文 】 


的 根 结 点 是 
只 有 一 个 结 点 


纳 尽 


6.1 























作 整 棵 树 的 根 画 在 最 上 层 。 





根 结 点 ， 


5 


:是 一 棵 含有 13 个 结 点 的 树 。 其 中 ，A 为 整 棵 树 的 “村 
的 子 集 TI={B, E,F,K,L}, Ti{G GY 和 Ts={D, H, 1, J 
子 树 ， 它 们 的 根 结 点 都 是 入 的 后 继 。 在 子 树 Ti 中 ，B 是 根 ， 其 余 元 
素 分 为 2 个 互 不 相交 的 子 集 T={E} 和 Tis= 征 ,KK,L}， 每 个 子 集 构成 一 棵 B 
B 的 后 继 ， 以 此 类 推 。 子 树 三 }_{K}、 拭 } 本 身 也 仍然 都 是 子 树 ， 
而 不 再 有 其 他 的 子 树 。 这 13 个 结 点 (数据 元 素 ) 之 则 





树 的 基本 概念 
用 的 非 线性 结构 。 我 们 可 以 这 样 定义 : 树 是 n(n 宇 0) 个 结 点 

















的 子 机 


4 有 限 集合 T。 


有 且 仅 有 一 个 特定 的 结 点 被 称 为 根 。 当 n>1 时 ， 其 余 结 点 被 分 成 
其 中 ， 每 个 子 集 又 是 一 棵 树 
日 此 可 以 看 出 ， 树 的 定义 是 递归 的 ， 即 树 是 一 种 递归 数据 
个 结 点 有 不 同 的 层次 关系 ， 这 种 关系 通常 用 图 
习惯 上 

图 6.1 所 万 
结 点 分 为 3 个 互 不 相交 
都 是 一 棵 树 ， 称 为 A 的 


， 并 称 为 根 的 
结构 ， 树 的 各 


形 表示 ， 但 与 自然 界 的 树木 相反 ， 











民 ”， 其 余 12 个 
M}， 每 个 子 集 


， 子 树 中 
不 过 这 3 棵 村 
存在 下 列 关系 : 





R={<A,B>,<A,C>,<A,D>,<B;E>;<B,F>,<C,G>,<D,H>,<DB,I>;<D,J>,<F,K>,<F,L>,<H,M>} 


需 








结 点 的 父亲 (双亲 ) 结 点 。 例 如 ， 图 
A 则 是 它们 的 父亲 结 点 。 实 际 上 ， 
同一 个 结 点 的 儿子 结 点 之 间 互 称 为 兄 并 


， 按 树 的 定义 , -有限 集合 Ti，T2， 
不 能 有 相 重 的 结 点 。 如 果 同 一 结 点 的 子 树 间 有 相 重 的 结 点 

下 面 介 绍 树 结构 中 

树 中 每 个 结 点 具有 的 子 树 数 或 者 后 继 结 点 数 称 为 
该 结 点 的 度 (degree)。 娘 
结 点 B 的 度数 为 2， 
为 0 等 。 度数 为 0 的 结 





… Mi 应 该 “ 互 不 相交 ”上 
就 不 能 称 为 树 了。 











用 的 术语 。 


币 


图 6.1 所 示 , 结 点 


结 点 C 的 度数 为 1， 





端 结 点 或 叶子 结 点 ， 
都 是 叶子 结 点 。 一 棵 树 中 各 个 结 点 度数 的 最 大 值 称 为 这 
个 树 的 度 。 图 6.1 中 的 树 以 结 点 A、D 的 度数 最 大 ， 都 











6.1 中 E、K、L、 





等 于 3， 故 该 树 的 度数 为 3。 
一 个 结 点 子 树 的 根 或 者 后 继 结 点 称 为 该 结 点 的 儿子 结 点 ， 反 之 ， 该 结 点 则 称 为 其 后 继 




















结 点 B 


兄弟 结 点 ， 结 点 H、I 和 J 之 间 互 为 兄弟 结 点 等 。 
一 个 结 点 的 子 树 中 的 所 有 结 点 均 称 为 该 结 点 的 子孙 结 点 。 例 如 ， 结 点 B 的 子孙 结 


点 有 BEB、F、K 和 L 结 点 ， 结 点 D 的 子孙 结 点 有 H、I、J 和 M 结 点 。 
根 结 点 以 外 ,所 有 结 点 都 是 根 结 点 的 子孙 结 点 。 图 6.1 中 , 结 点 A 





点 ， 即 没有 子 树 的 结 点 ， 


任意 两 个 集合 


A 的 度数 为 3， 
结 点 芽 的 度数 
称 为 终 
G、M、I 和 J 








6.1 中 ， 结 点 B、C 和 DD 都 是 结 点 A 的 儿子 结 点 ， 结 点 
-个 结 点 的 度数 也 就 是 它 的 儿子 结 点 的 数目 。 
和 B 结 点 。 例 如 ， 图 6.1 中 ， 


、C 和 DD 互 为 


， 除 整个 树 的 


共有 12 个 子孙 结 点 。 


、 一 


GO ~ ~ 


反之 ， 从 根 结 点 到 达 一 个 结 点 的 路 径 上 的 所 有 结 点 ， 都 称 为 该 结 点 的 祖先 结 点 。 例 如 ， 
图 6.1 中 ， 从 A 到 M 的 路 径 上 有 A、D、H 共 3 个 结 点 ， 故 这 3 个 结 点 都 是 M 结 点 的 








祖先 结 点 。 
上 述 的 父子 结 点 、 兄 弟 结 点 、 子 孙 结 点 、 祖先 结 点 等 都 是 仿照 人 的 家 族 关系 来 定义 的 ， 











并 不 考虑 “ 旁 系 ”的 结 点 。 例 如 ， 图 6.1 中 ， 对 于 E 和 F 结 
点 来 说 ，C 结 点 是 它们 父亲 结 点 B 的 兄弟 结 点 ， 但 在 此 C 结 点 不 作为 E、F 结 点 的 祖先 看 
待 。 同 理 ，E、F 结 点 也 不 算 作 C 结 点 的 子孙 结 点 。 

树 是 一 种 层次 结构 ， 树 中 结 点 的 层次 (level) 是 从 根 结 点 算 起 的 。 根 结 点 为 第 1 层 ， 其 
儿子 结 点 是 第 2 层 。 其 余 各 结 点 的 层 数 逐 层 由 上 而 下 计算 。 若 某 结 点 在 第 K 层 , 则 其 儿子 结 
点 在 第 (K+1) 层 。 由 此 可 知 某 结 点 的 祖先 数 等 于 它 的 层 数 减 1。 例 如 ， 图 6.1 中 ， 结 点 M 在 
第 4 层 , 它 有 3 个 祖先 。 又 如 ， 结 点 B 在 第 2 层 , 它 只 有 1 个 祖先 , 根 结 点 在 第 1 层 ， 它 没 
有 祖先 。 一 棵 树 中 结 点 的 最 大 层 数 称 为 此 树 的 深度 或 高 度 。 图 -6.1 中 的 树 ， 其 深度 等 于 4。 

n 个 树 的 集合 称 为 森林 (forest)。 若 一 棵 树 原 有 n 个 子 树 ,, 将 其 根 结 点 去 掉 ， 那么 , 这 n 
个 子 树 就 成 为 森林 。 如 图 6.1 中 所 示 的 树 ， 将 根 结 点 .A 去 掉 就 变 成 有 3 棵 树 的 森林 。 

树 状 结构 的 逻辑 特征 可 用 树 中 结 点 之 间 的 父子 关系 来 描述 : 树 中 任 一 结 点 都 可 以 有 零 
个 或 多 个 直接 后 继 结 点 ( 即 儿 子 结 点 ), 但 至 多 只 能 有 二 个 直接 前 趋 结 点 ( 即 父亲 结 点 )。 树 中 
只 有 根 结 点 无 前 趋 ， 则 是 开始 结 点 ; 叶子 结 点 无 后 继 ， 则 是 终端 结 点 。 显 然 ， 树 中 结 点 之 
间 的 关系 是 非 线 性 的 ， 树 状 结构 是 非 线性 结构 。 

树 的 抽象 数据 类 型 定义 : 

ADT Treel{ 

数据 对 象 : D ={ ai | ait EElemType, i=1,2,...1n, n>=0 } 
//ElemType 是 自 定义 的 类 型 标识 符 
数据 关系 : R ={ <ai ,ai >lai,a1ED,i=1, .nyj=1,...,n， 其 中 每 个 元 素 只 有 一 个 直 
接 前 趋 ， 可 以 有 零 个 或 多 个 直接 后 继 ， 有 且 仅 有 一 个 元 素 没 有 直接 前 趋 } 


但 所 谓 的 祖先 结 点 和 子孙 结 

























































基本 操作 : 
InitTree(gT) // 初 始 化 树 : 构造 一 个 空 树 了 
ClearTree(&T) // 销 毁 树 : 释放 树 T 占用 的 存储 空间 
Parent(t) // 求 元 素 t 的 直接 前 趋 
Sons(t) // 求 元 素 t 的 所 有 直接 后 继 


6.2 二 又 树 


6.2.1 ”二叉树 的 基本 概念 


二 又 树 在 图 论 中 是 这 样 定义 的 :二 又 树 是 一 个 连通 的 无 环 图 ， 并 且 每 一 个 项 ”回回 
点 的 度 不 大 于 2。 有 根 二 又 树 还 要 满足 根 结 点 的 度 不 大 于 2。 有 了 根 结 点 之 后 ，。 识 : 弦 中 
每 个 顶点 定义 了 唯一 的 父 结 点 和 最 多 两 个 子 结 点 。 然 而 ， 没 有 足够 的 信息 来 区 分 百 

左 结 点 和 右 结 点 。 如 果 不 考虑 连通 性 ， 允 许 图 中 有 多 个 连通 分 量 ， 这 样 的 结构 称 【参考 图 文 】 


作 和 森林 。 
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在 计算 机 科学 中 ， 二 又 树 是 每 个 结 点 最 多 有 两 个 子 树 的 树 。 通 常 子 树 的 根 被 称 作 左 子 
树 (left subtree) 和 右 子 树 (right subtree)。 二 又 树 的 每 个 结 点 至 多 只 有 上 琴 棵 子 树 (不 存在 度 大 于 
2 的 结 点 )， 二 又 树 的 子 树 有 左 、 右 之 分 ， 次 序 不 能 颠倒 。 

通过 上 面 的 表述 ， 我 们 知道 树 和 二 又 树 的 差别 主要 包括 以 下 两 点 。 

(D 树 中 结 点 的 最 大 度数 没有 限制 ， 而 二 又 树 结 点 的 最 大 度数 为 2。 

(2) 树 的 结 点 无 左 、 右 之 分 ， 而 二 又 树 的 结 点 有 左 、 右 之 分 。 

二 又 树 也 可 以 用 递归 的 形式 定义 , 即 二 又 树 是 n(n 宇 0) 个 结 点 的 有 限 集 合 。 当 n=0 时 ， 
称 为 空 二 叉 树 ， 当 n > 0 时 ， 有 且 仅 有 一 个 结 点 为 二 又 树 的 根 ， 其 余 结 点 被 分 成 两 个 互 不 
相交 的 子 集 ， 一 个 作为 左 子 集 ， 另 一 个 作为 右 子 集 ， 每 个 子 集 又 是 一 个 二 又 树 。 

上 述 数据 结构 的 递归 定义 表明 二 又 树 或 为 室 ， 或 是 由 一 个 根 结 点 加 上 两 棵 分 别称 为 左 
子 树 和 右 子 树 、 互 不 相交 的 二 叉 树 组 成 。 由 于 这 两 棍子 树 也 是 二 叉 树 ， 则 由 二 又 树 的 定义 
可 知 ， 它 们 也 可 以 是 空 树 。 由 此 ， 二 又 树 可 以 有 5 种 基本 形态 ， 如 图 6.2 所 示 。 


a 
$ OO CD ‘7D 


(a) 空 树 人 b) 根 结 点 〈e) 左 了 树 ,， < (d) 石 了 树 (e) 满 一 又 树 
图 6.2… 三 又 树 的 5 种 形态 


如 果 一 个 深度 为 h 的 二 叉 树 拥有 2"-1 个 结 点 ， 则 将 它 称 为 满 二 又 树 。 满 二 又 树 的 所 有 
分 支 结 点 都 存在 左 子 树 和 右 子 树 ， 并 且 所 有 叶子 结 点 都 在 同一 层 上 ， 如 图 6.3 所 示 。 



































有 一 棵 深度 为 h， 具 有 n 个 结 点 的 二 叉 树 ， 若 将 它 与 一 棵 同 深度 的 满 二 叉 树 中 的 所 有 
结 点 按 从 上 到 下 、 从 左 到 右 的 顺序 分 别 进行 编号 ， 且 该 二 又 树 中 的 每 个 结 点 分 别 与 满 二 又 
树 中 编号 为 1~n 的 结 点 位 置 一 一 对 应 ， 则 称 这 棵 二 又 树 为 完全 二 又 树 。 图 6.4 所 示 为 完全 
二 义 树 ， 而 图 6.5 所 示 为 非 完全 二 叉 树 。 将 图 6.5 所 示 非 完全 二 又 树 中 的 虚 结 点 5、8、10、 
11、12、13 补 上 ， 就 构成 了 一 棵 完全 二 又 树 。 























O 
gf 癌 ,2 

OOOOGS ® DO 
图 6.4 完全 二 叉 树 图 6.5 非 完全 二 叉 树 


6.2.2 二叉树 的 性 质 


二 叉 树 具 有 下 列 5 个 重要 的 性 质 : 
性 质 1 在 二 又 树 的 第 i 层 上 最 多 有 27 个 结 点 (i 之 1)。 
证 明 ; i=1 时 ， 只 有 一 个 根 结 点 。 显 然 ，2™'=2" = 1 是 对 的 。 
现在 假定 对 所 有 的 j，1 夺 j<i， 命题 成 立 ， 即 第 j 层 上 至 多 有 2 站 个 结 点 。 那么 ,可 以 
证 明 i 二 时 命题 也 成 立 。 
归纳 假设 : 第 i-1 层 上 至 多 有 2 个 结 点 。 由 于 二 叉 树 的 每 个 结 点 的 度 至 多 为 2， 故 
在 第 i 层 上 的 最 大 结 点 数 为 第 i-1 层 上 的 最 大 结 点 数 的 2 倍 ， 即 2x2™? =2m。 

性 质 2 深度 为 h(h > 1) 的 二 叉 树 最 多 有 2"-1 个 结 点 。 

证 明 ， 设 第 i 层 上 的 结 点 为 x (1 二 i 二 h )， 深 度 为 h 的 二 叉 树 的 结 点 数 为 M，x 最 多 
为 2"， 则 有 K 信 






































M-y xs<y na S\ (6.1) 
i=1 i=1 下 


性 质 3 对 于 任意 一 棵 二 又 树 BT,， 如 果 度 为 0 的 结 点 个 数 为 mn, 度 为 2 的 结 点 个 数 为 
nz， 则 no=nz+l 。 ANX 

证 明 ， 假 设 度 为 1 的 结 点 个 数 为 nif 结 吉 总 数 为 mn，B 为 二 又 树 中 的 分 支 数 。 因 为 在 
二 又 树 中 ， 所 有 结 点 的 度 均 小 于 或 等 于 2 所 以 结 点 总 数 为 

n=no+ni+n2 0 ~ (6.2) 

再 查看 一 下 分 支 数 。 在 三 义 树 中 ， 除 根 结 点 之 外 六 每 个 结 点 都 有 一 个 从 上 向 下 的 分 支 
指向 ， 所 以 ， 总 的 结 点 个 数 n 与 分 支 数 B 之 间 的 关系 为 n=B+1。 

又 因为 在 二 叉 树 中 ， 度 为 1 的 结 点 产生 :1 个 分 支 ， 度 为 2 的 结 点 产生 2 个 分 支 ， 所 以 
分 支 数 B 可 以 表示 为 
































B=ni+2n2 (6.3) 
将 式 (6.3) 代 入 关系 式 n=B+1， 得 
n=n1+2n2+1 (6.4) 
式 (6.4) 减 去 式 (6.2)， 并 经 过 调整 后 得 到 
no=n2+l (6.5) 


性 质 4 具有 nm 个 结 点 的 完全 二 又 树 的 深度 为 Llog,nj+1 或 fog:n+D]。 其 中 ， 
Liog;n] 的 结果 是 不 大 于 log; n 的 最 大 整数 ， 而 fog:+D] 的 结果 是 不 小 于 log,(n+D 的 
最 小 整数 。 

证 明 : 根据 完全 二 叉 树 的 定义 和 性 质 2 可 知 ， 当 一 棵 完全 二 叉 树 的 深度 为 k 、 结 点 个 
数 为 n 时 ， 有 

26 -1<n<2* -1 
即 
多 2 (6.6) 


只 


对 不 等 式 取 对 数 ， 有 





2i。 
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CC 




















于 k 是 整数 ， 则 有 
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k-l<log,n<k 


k=|log,nj+l (6.7) 


性 质 5 对 有 nm 个 结 点 的 完全 二 叉 树 中 的 所 有 结 点 按 从 上 到 下 、 从 左 到 右 的 顺序 进行 


编号 ， 则 对 任意 一 个 结 点 i(1<i<n)， 都 有 : 











(1) 如 果 二 1， 则 结 点 i 是 这 棵 完全 二 叉 树 的 根 ， 没 有 双亲 ; 如 果 这 1， 则 其 双亲 结 点 
的 编号 为 Li/2J。 
(2) 如 果 2i>n， 则 结 点 i 没有 左 孩 子 ( 结 点 i 为 叶子 结 点 ); 否则 其 左 孩 子 结 点 的 编号 为 





(3) 如 果 2it1>n， 则 结 点 i 没有 右 孩 子 ， 否 则 其 右 孩 子 结 点 的 编号 为 2i+1。 
我 们 以 图 6.6 为 例 来 理解 这 个 性 质 。 这 是 一 棵 完全 二 又 树 ， 深 度 为 4， 结 点 总 数 是 10。 






6.6” 一 棵 完全 二 又 树 


第 一 个 结论 是 很 显然 的 ，i=1 时 就 是 根 结 点 。i>1 时 如 对 于 结 点 7， 它 的 双亲 就 是 
[7/2]=3: 对 于 结 点 9， 它 的 双亲 就 是 [9/2]=4。, ,站 


对 于 第 二 个 结论 ， 如 结 点 -6; 因 


为 2x6=12， 超 过 了 了 结 点 总 数 10， 所 以 结 点 6 无 左 孩 


子 ， 它 是 叶子 结 点 。 同 样 ， 对 于 结 点 5， 因 为 2x5=10 ， 正 好 是 结 点 总 数 10， 所 以 它 的 左 


孩子 是 结 点 10。 C= 


对 了 








F 第 三 个 结论 ， 如 结 点 5， 因 








为 2x54T11， 大 于 结 点 总 数 10， 所 以 它 无 右 孩子。 


而 结 点 3， 因 为 2x3+1=7 ， 小 于 10， 所 以 它 的 右 孩 子 是 结 点 7。 
6.2.3 ”二叉树 的 存储 结构 
二 义 树 可 以 采用 两 种 存储 方式 : 


从 小 到 大 的 顺序 就 是 结 点 存放 在 连续 存储 单元 的 先后 次 序 。 若 把 二 又 树 存储 到 一 维 数组 中 


网 











顺序 存储 结构 














顺序 存储 结构 和 链 式 存储 结构 。 














这 种 存储 结构 适用 于 完全 二 又 树 ， 如 图 6.7(a) 所 示 ， 其 存储 形式 为 用 一 组 地 址 连续 的 
存储 单元 按照 完全 二 又 树 的 每 个 结 点 编号 的 顺序 存放 结 点 内 容 。 因 此 ， 必 须 确 定好 树 中 各 
数据 元 素 的 存放 次 序 ， 使 得 各 数据 元 素 在 这 个 存放 次 序 中 的 相互 位 置 能 反映 出 数据 元 素 之 
间 的 逻辑 关系 。 
二 叉 树 的 顺序 存储 结构 中 结 点 的 存放 次 序 如 下 : 对 该 树 中 每 个 结 点 进行 编号 ， 其 编号 






































则 该 编号 就 是 下 标 值 加 1( 注 意 ，C/C++ 语 言 中 数组 的 起 始 下 标 为 0)。 树 中 各 结 点 的 编号 与 








等 高 度 的 完全 二 又 树 中 对 应 位 置 上 结 点 的 编号 相同 。 其 编号 过 程 如 下 : 首先 把 树 根 结 点 的 





编号 定位 为 1， 然 后 按照 层次 从 上 到 下 、 每 层 从 左 到 右 的 顺序 ， 对 每 一 结 点 进行 编号 。 若 


@y 


6 i 


它 是 编号 为 i 的 双亲 结 点 的 左 孩 子 结 点 ， 则 它 的 编号 应 为 2i; 车 它 是 右 孩子 结 点 ， 则 它 的 
编号 应 为 (2i+1)。 

根据 二 又 树 的 性 质 5, 在 二 又 树 的 顺序 存储 中 的 各 结 点 之 间 的 关系 可 通过 编号 (存储 位 置 ) 
确定 。 对 于 编号 为 i 的 结 点 ( 即 第 i 个 存储 单元 )， 其 双亲 结 点 的 编号 为 |i/2|; 车 存在 左 孩 子 
结 点 ， 则 左 孩 子 结 点 的 编号 (下 标 ) 为 2i; 若 存在 右 孩 子 结 点 ， 则 右 孩 子 结 点 的 编号 (下 标 ) 为 
(2i+t1)。 因 此 , 访问 每 一 个 结 点 的 双亲 和 左 、 右 孩子 结 点 (车 有 的 话 ) 都 非常 方便 。 当 二 又 树 中 
某 结 点 为 空 结 点 或 无 效 结 点 (不 存在 该 编号 的 结 点 ) 时 ， 对 应 位 置 的 值 用 特殊 值 (如 和 ) 表 示 。 
图 6.7 所 示 是 一 棵 二 又 树 及 其 相应 的 存储 结构 。 
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(a) 完全 一 又 树 NN 厂 (b) 顺序 存储 结构 
图 6.7 ”二叉树 及 其 相应 的 存储 结构 


图 6.5 所 示 非 完全 二 叉 树 的 顺序 存储 结构 如 图 6.8 所 示 。 


[of1[2?213E4|TsheT7|s To {ll2T31 | 
| Talslelol#TrloT# irl#T#l#lTr)] 
图 6.8 顺序 存储 结构 


如 图 6.6(b) 和 图 6.8. 所 示 ， 下 标 为 0 的 位 置 不 使 用 ， 赋 任意 字符 值 ， 其 他 位 置 上 # 字 符 
表示 空 结 点 或 无 效 结 点 。 

对 于 完全 二 又 树 来 说 ， 其 顺序 存储 是 十 分 合适 的 ， 它 能 够 充分 利用 存储 空间 。 但 对 于 
一 般 的 二 又 树 ， 特 别 是 对 于 那些 单 分 支 结 点 较 多 的 二 叉 树 来 说 是 很 不 合适 的 ， 因 为 可 能 只 
有 少数 存储 单元 被 利用 ， 特 别 是 对 退化 的 二 又 树 ( 即 每 个 分 支 结 点 都 是 单 分 支 的 )， 空 间 浪 
费 更 是 惊人 。 由 于 顺序 存储 结构 这 种 固有 的 缺陷 ， 使 得 二 又 树 的 插入 、 删 除 等 运算 十 分 不 
方便 。 因 此 ， 对 于 一 般 二 叉 树 通常 采用 链 式 存储 方式 。 

考虑 一 种 极端 情况 ， 一 棵 深度 为 h 的 右 斜 树 ， 它 只 有 个 结 点 ， 却 需要 分 配 2"-1 个 存 
储 单元 空间 ， 这 显然 是 对 存储 空间 的 浪费 ， 如 图 6.9 所 示 。 所 以 顺序 存储 结构 一 般 只 用 于 
完全 二 又 树 结构 。 

在 C 语言 中 ， 这 种 存储 形式 的 类 型 定义 如 下 : 
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#define MAXSIZE 100 // 存 储 空间 初始 分 配 量 
#define MAXTREESIZE 100 // 二 叉 树 的 最 大 结 点 数 
下 面 我 们 给 出 完全 二 叉 树 在 这 种 存储 形式 下 的 操作 算法 。 

1) 构造 一 棵 二 又 树 


按 层 序 次 序 输入 二 又 树 中 结 点 的 值 (字符 型 或 整 型 )， 构 造 顺序 存储 的 二 又 树 T。 其 0 
号 单元 存储 二 又 树 是 否 为 空 的 标志 ，0 表示 二 叉 树 为 空 ， 否 则 不 为 空 。 
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右 斜 树 


加 相 避 的 股评 存 和 构 
6.9 右 斜 树 及 其 相应 的 顺序 存储 结构 


算法 6.1 二 又 树 的 构造 








2) 获取 给 定 结 点 的 左 孩 子 
算法 6.2 ”获取 左 孩 子 


= 
er 





3) 获取 给 定 结 点 的 双亲 
算法 6.3 ”获取 双亲 





2， 链 式 存储 结构 


ae > et 
于 非 完全 二 叉 村 第 要 将 全 所 的 位 置 用 特定 的 符号 填补 ， 若 全 所 结 点 较 多 势必 造成 间 
利用 率 的 下 降 、\ 在 这 种 情况 下 ， 就 应 该 考 由 全 用 链 式 存储 结构 。 

常见 的 二 六 村 结 点 结构 如 图 6.10 所 示 。 其 中 ，Ichild 和 rehild 是 分 别 指向 该 结 点 左 入 
子 和 右 孩 子 的 指针 ，data 是 数据 元 素 的 内 容 。 


图 6.10 ”二叉树 结 点 结构 
在 C 语言 中 的 类 型 定义 如 下 : 


图 6.11 所 示 是 一 棵 二 叉 树 及 其 相应 的 链 式 存储 结构 。 
这 种 存储 结构 的 特点 是 寻找 孩子 结 点 容易 ， 寻 找 双 亲 就 比较 困难 。 因 此 ， 若 需要 频繁 
地 寻找 双亲 ， 可 以 给 每 个 结 点 添加 一 个 指向 双亲 结 点 的 指针 域 ， 这 样 的 存储 结构 我 们 称 为 


三 叉 链表 。 其 结 点 结构 如 图 6.12 所 示 。 
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其 相应 的 三 叉 链 式 存 储 结构 如 图 6.11(c) 所 示 。 


Lz LBEA. Eeesl 


加 (5) (> [TDT [TEST 和 |] LFI^] 


(©) 四 i 


(a) 一 棵 二 又 树 i re 构 


BT: 




























(c) 三 又 链 发 存储 结构 
6.11 二 叉 树 及 其 相应 的 链 式 存储 结构 


6'12 ”二 又 树 链 式 存储 的 结 点 结构 


6.2.4 二 又 树 的 遍历 


二 叉 树 的 遍历 是 指 按照 站 次 衣 区 且 二 又 树 中 的 所 有 结 点 ， 并 且 每 个 结 点 仅 被 访问 一 
次 的 过 程 。 它 是 最 基本 的 运算 ， 是 二 又 树 中 所 有 其 他 运算 的 基础 。 
按 根 D、 左 子 树 L 和 右 FR R 3 部 分 进行 遍历 。 根 据 根 访问 的 位 置 不 同 分 别 分 为 先 序 


遍历 (DLR)、 中 序 遍 历 (LDR)、 后 序 遍历 (LRD)。 
1， 先 序 遍 历 二 又 树 


若 二 又 树 为 室 ， 则 结束 遍历 操作 ;， 否则， 首先 访 问 根 结 点 ， 然 后 先 序 遍 历 根 结 点 的 左 
子 树 ， 最 后 先 序 遍 历 根 结 点 的 右 子 树 。 

例如 ， 图 6.11(a) 所 示 的 二 又 树 的 先 序 序列 为 ABDGCEFH。 显 然 ， 在 一 棵 二 又 树 的 先 
序 序列 中 ， 第 一 个 元 素 即 为 根 结 点 对 应 的 结 点 值 。 其 归 算 法 如 下 ， 

算法 6.4” 先 序 遍历 二 又 树 

void PreOrderTraverse(BiTree T) 





if(T==NULL) 

return; 
printf("s%c", T->data); 
PreOrderTraverse(T->lchild); 
PreOrderTraverse(T->rchild); 


© eg 
2， 中 序 遍 历 二 又 树 


若 二 又 树 为 空 ， 则 结束 遍历 操作 ;， 否则， 首先 中 序 遍 历 左 子 树 ， 然 后 访问 根 结 点 ， 最 
后 中 序 遍 历 右 子 树 。 

例如 ， 图 6.11(a) 所 示 的 二 又 树 的 中 序 序列 为 DGBAECHF。 显 然 ， 在 一 棵 二 又 树 的 中 
序 序列 中 ， 根 结 点 值 将 其 序列 分 为 前 、 后 两 部 分 ， 前 部 分 为 左 子 树 的 中 序 序列 ， 后 部 分 为 
右 子 树 的 中 序 序列 。 其 递归 算法 如 下 : 

算法 6.5 ”中 序 裔 历 二 又 树 

void InOrderTraverse(BiTree T) 


{ 











if(T==NULL) 

return; 严 
InOorderTraverse(T->lchild); // 中 序 遍历 左 了 树 * 
printf("%c",T->data); // 显 示 结 点 数据 ， 可 以 更 改 为 其 他 对 结 点 操作 


InOorderTraverse(T->rchild); wr 树 
} x 


3， 后 序 遍历 二 又 树 SY 

若 二 又 树 为 空 ， 则 结束 遍历 操作 ;和 否则; 首先 后 序 遍 历 左 子 树 ， 然 后 后 序 遍 历 右 子 树 ， 
最 后 访问 根 结 点 。 SA 和 仆 

例如 ， 图 6.11(a) 所 示 的 二 叉 树 的 后 序 序列 为 GDBEHFCA。 显 然 ， 在 一 棵 二 又 树 的 后 
序 序列 中 ， 最 后 一 个 元 素 即 为 根 结 点 对 应 的 结 点 值 。 其 递归 算法 如 下 : 

算法 6.6 ”后 序 遍 历 二 又 树 


四 ~ AS 
void PostOrderTraverse(BiTree T) A p 
yy AN 


( Cos Sy 
if(T==NULL) [~ 
\ i 
return; 


PostOrderTraverse(T->lchild); 
PostOrderTraverse(T->rchild); 
printf("%c",T->data); 
} 
此 外 ， 还 有 一 种 层次 遍历 方法 ， 若 二 叉 树 非 空 (假设 其 高 度 为 h)， 则 : 
名 访问 根 结 点 (第 1 层 ); 
@ 从 左 到 右 访问 第 2 层 的 所 有 结 点 ; 
@ 从 左 到 右 访问 第 3 层 的 所 有 结 点 、…… 、 第 h 层 的 所 有 结 点 。 
例如 ， 图 6.11(a) 所 示 的 二 又 树 的 层 序 序列 为 ABCDEFGH 。 
我 们 用 图 形 的 方式 来 表现 树 的 结构 ， 应 该 说 是 非常 直观 和 容易 理解 的 ， 但 是 对 于 计算 
机 来 说 ， 它 只 有 循环 、 判 断 等 方式 来 处 理 ， 也 就 是 说 ， 它 只 会 处 理 线性 序列 ， 而 我 们 刚才 
提 到 的 4 种 遍历 方法 ， 其 实 都 是 在 把 树 总 的 结 点 变 成 某 种 意义 的 线性 序列 ， 这 就 给 程序 的 
实现 带 来 了 好 处 。 
另外 ， 不 同 的 遍历 提供 了 对 结 点 依次 处 理 的 不 同方 式 ， 可 以 在 遍历 过 程 中 对 结 点 进行 


各 种 处 理 。 
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6.2.5 二叉树 的 构造 


定理 1 任何 n(n>0) 个 不 同 结 点 的 二 叉 树 ， 都 可 由 它 的 先 序 序列 和 中 序 序列 唯一 地 确定 。 

证 明 : 采用 数学 归纳 法 证 明 。 

当 n=0 时 ， 二 又 树 为 空 ， 结 论 正确 。 

假设 结 点 数 小 于 n 的 任何 二 又 树 ， 都 可 以 用 其 先 序 序列 和 中 序 序列 唯一 地 确定 。 若 某 
棵 二 叉 树 具有 n(n>0) 个 不 同 结 点 ， 其 先 序 序列 是 ata…a ， 中 序 序列 是 
bobi…bk_ibkby,…b, ，。 因 为 在 先 序 遍 历 过 程 中 ， 访 问 根 结 点 后 ， 紧 跟着 遍历 左 子 树 ， 最 
后 再 遍历 右 子 树 ， 所 以 ao 必定 是 二 又 树 的 根 结 点 ， 而 且 ao 必 然 在 中 序 序列 中 出 现 。 也 就 是 
说 ， 在 中 序 序列 中 必 有 某 个 b. (0 秋 k<n-1) 就 是 根 结 点 ao 。 
由 于 尽 是 根 结 点 ， 而 在 中 序 遍历 过 程 中 ， 先 遍历 左 子 树 ， 再 访问 根 结 点 ， 最 后 再 遍历 
右 子 树 。 所 以 在 中 序 序列 中 ，bobj…bkbvb…b, 必 是 根 结 点 bi (也 就 是 as) 左 子 树 中 的 
中 序 序列 ， 即 bu 的 左 子 树 有 k 个 结 点 (注意 ，k=0 表示 结 点 忆 没 有 左 子 树 )， 而 bb, 必 
是 根 结 点 b (也 就 是 ao ) 右 子 树 中 的 中 序 序列 ， 即 b, 的 右 子 树 有 mrkr1 个 结 点 (注意 ，k= 
n-k-1 表示 结 点 bx 没有 右 子 树 )。 

另外 , 在 先 序 序列 中 , 紧 跟 在 根 结 点 a 之 后 的 长 个 结 点 a1…ai 就 是 左 子 树 的 先 序 序列 ， 
al…an 这 n-k-1 就 是 右 子 树 的 先 序 序列 2 

根据 归纳 假设 ， 由 于 子 先 序 序列 aa 和子 中 序 序列 btb…bk- 可 以 唯一 地 确定 根 结 
点 ao 的 左 子 树 ， 而 子 先 序 序列 a ,as 和 子 中 序 序列 bui2sb。 可 以 唯一 地 确定 根 结 点 ao 
的 右 子 树 。 

综 上 所 述 ， 这 棵 二 叉 树 的 根 结 点 已 经 确定 ， 而 县 其 左 、 右 子 树 都 唯一 确定 了 ， 所 以 整 
个 二 又 树 也 就 唯一 地 确定 了 。 

实际 上 ， 先 序 序列 的 作用 是 确定 一 颗 二 又 树 的 根 结 点 (其 第 一 个 元 素 即 为 根 结 点 )， 中 
序 序列 的 作用 是 确定 左 、 右 子 树 的 中 序 序列 ( 含 各 自 的 结 点 个 数 )， 反 过 来 又 可 以 确定 左 、 
右 子 树 的 先 序 序列 。 

例 6.1 假设 有 一 棵 二 又 树 的 先 序 遍历 序列 为 ABDGCEFH, 中 序 遍 历 序列 为 DGBAECHEF， 
则 这 棵 二 又 树 的 后 序 遍 有 历 结果 是 什么 ? 

解 ， 由 于 先 序 遍 历 序列 为 四 ppDGCEFH， 我 们 知道 A 就 是 根 结 点 的 数据 。 再 由 中 序 遍 
历 序列 是 DGBAJECHF， 可 以 知道 D、G 和 B 是 A 的 左 子 树 上 的 结 点 ， 而 E、C、H 和 下 
是 A 的 右 子 树 上 的 结 点 ， 如 图 6.13 所 示 。 

() 


图 6.13 ”遍历 根 结 点 
然后 ， 我 们 来 看 先 序 序列 中 的 B、D 和 G， 它 的 顺序 是 A 加 DGCEFH 中 B 排 在 D 和 G 
的 前 面 ， 所 以 B 应 该 是 A 的 左 孩子 , 而 D 和 G 是 B 的 孩子 或 者 孙子 ， 此 时 还 不 能 确定 ， 
如 图 6.14(a) 所 示 。 再 看 中 序 序列 DG 回 AECHF, D 在 G 的 前 面 , 这 就 说 明 DD 是 B 的 左 孩子 。 
先 序 和 中 序 序列 中 D 都 排 在 G 的 前 面 ， 所 以 说 G 是 D 的 右 孩 子 ， 如 图 6.14(b) 所 示 。 
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(a) (b) 
图 6.14 遍历 左 子 树 


再 看 先 序 序列 中 的 C、E、F、H， 它 的 顺序 是 ABDGICEF 相 ， 那 就 意味 着 C 是 A 结 点 
的 右 孩 子 ，E、F 和 H 是 C 的 子孙 。 注意 ,它们 中 有 一 个 不 一 定 是 孩子 ， 还 有 可 能 是 孙子 。 
再 来 看 中 序 序列 DGBAEIdHF， 由 于 E 在 C 的 左 侧 , 而 HH 和 下 在 右 侧 ， 所 以 可 以 确定 EE 是 
C 的 左 孩 子 ，H 和 F 是 C 的 子孙 。 又 因为 先 序 序列 中 F 在 H 的 前 面 ， 中 序 序列 中 旦 在 F 
的 前 面 ， 所 以 我 们 得 到 了 HH 是 F 的 左 孩子 。 因 此 ， 最 终 得 到 的 三 又 树 如 图 6.11(a) 所 示 。 

为 了 避免 推导 错误 ， 我 们 可 以 检查 一 下 得 到 的 这 棵 树 的 先 序 遍历 和 中 序 遍 历 是 否 与 题 
目 中 的 相同 。 已 经 复原 了 二 又 树 ， 要 获得 它 的 后 序 遍 历 结果 就 很 简单 了 ， 结 果 是 
GDBEHFCA。 NA 

定理 2 ”任何 nn>0) 个 不 同 结 点 的 二 又 树 汪 都 可 由 它 的 中 序 序列 和 后 序 序列 唯一 地 确定 。 

证 明 : 同样 采用 数学 归纳 法 证 明 。 

当 n=0 时 ， 二 又 树 为 空 ， 结 论 正确 * 

假设 结 点 数 小 于 n 的 任何 三 丸 树 ,都 可 以 用 其 中 序 序列 和 后 序 序列 唯一 地 确定 。 

若 某 棵 二 又 树 具 有 n(n>0) 个 不 同 结 点 , 其 中 序 序列 是 bobi…b,_,， 后 序 序列 是 a0a1…a_1。 
因为 在 后 序 帝 历 过 程 中, 先 遍历 左 子 树 , 再 遍历 右 子 树 , 最 后 访问 根 结 点 , 所 以 a 必 
定 是 二 又 树 的 根 结 点 》 而 且 a 必然 在 中 序 序列 中 出 现 。 也 就 是 说 ， 在 中 序 序列 中 必 有 某 
个 bt(O<k<m-1) 就 是 根 结 点 ai 。 
由 于 b, 是 根 结 点 ， 而 在 中 序 遍 历 过 程 中 ， 先 遍历 左 子 树 ， 再 访问 根 结 点 ， 最 后 遍历 右 子 
树 ， 所 以 在 中 序 序列 中 ，b。…bi_, 必 是 根 结 点 b (也 就 是 a,_, ) 左 子 树 中 的 中 序 序列 , 即 b 的 左 
子 树 有 k 个 结 点 (注意 , k=0 表示 结 点 b 没有 左 子 树 )。 而 bl …b,， 必 是 根 结 点 b (也 就 是 a ) 
右 子 树 中 的 中 序 序列 ， 即 b 的 右 子 树 有 n-k-1 个 结 点 (注意 ，k=n-1 表示 结 点 b 没有 右 子 树 )。 
另外 ， 在 后 序 序列 中 ， 在 根 结 点 a 之 前 的 n-k-1 个 结 点 a…a,_, 就 是 右 子 树 的 后 序 
序列 ，ao…ak 中 不 就 是 左 子 树 的 后 序 序列 。 
根据 归纳 假设 ， 由 于 子 中 序 序列 bo…bk 和 子 后 序 序列 ao…ak 可 以 唯一 地 确定 根 结 
点 b (也 就 是 a ) 的 左 子 树 ， 而 子 中 序 序列 bb 和 子 后 序 序列 ak…an 可 以 唯一 地 确 
定 根 结 点 b 的 右 子 树 。 

综 上 所 述 ， 这 棵 二 又 树 的 根 结 点 已 经 确定 ， 而 且 其 左 、 右 子 树 都 唯一 确定 了 ， 所 以 整 
个 二 叉 树 也 就 唯一 地 确定 了 。 

例 6.2 ”如 果 已 知 二 又 树 的 中 序 序列 为 DGBAECHF， 后 序 序列 是 GDBEHFCA， 求 先 
序 序列 。 

解 : 这 要 相对 简单 点 ， 由 后 序 的 GDBEHFCA， 得 到 A 是 根 结 点 。 于 是 根据 中 序 序列 


的 DGBAECHF 分 为 两 棵 树 DGB 和 ECHF， 如 图 6.15 所 示 。 
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图 6.15 遍历 根 结 点 


由 后 序 序列 的 GDBEHFCA 知道 , B 是 A 左 孩子 的 根 结 点 ,而 C 是 A 右 孩 子 的 根 结 点 。 
如 图 6.16 所 示 。 





BB) (©O 
oD Em 
图 6.16 遍历 左 子 树 根 和 右 子 树 根 


中 序 中 的 DGB 和 后 序 中 的 GDB， 我 们 可 以 知道 D 和 G 都 在 B 的 左 侧 ， 且 D 是 B 
的 左 孩子 ，G 是 D 的 右 孩 子 ， 如 图 6.17 所 示 。 > 























图 6.17 遍历 左 子 树 


同 理 , 由 中 序 中 的 ECHF 推出 E 和 HF 分 别 在.C 的 左右 两 侧 , 即 E 是 C 的 左 孩 子 结 点 
HF 为 右 孩子 结 点 。` 由 中 序 中 的 HF 和 后 序 中 的 HF 可 知 ， 我 们 可 以 得 到 F 是 C 的 右 孩 子 ， 
HH 是 F 的 左 孩子 最后， 我们 得 到 完整 的 三 义 树 如 图 6.11(a) 所 示 。 

这 样 ， 我 们 就 能 很 容易 得 到 该 二 叉 树 的 先 序 序列 : ABDGCEFH。 


6.3 树 和 和 森林 


6.3.1 树 、 和 森林 与 二 又 树 的 转换 


树 、 森 林 与 二 又 树 之 间 有 一 个 自然 的 对 应 关系 ， 它 们 之 间 可 以 互相 进行 转换 ， 即 任何 
一 个 森林 或 一 棵 树 都 可 以 唯一 地 对 应 一 棵 二 又 树 ， 而 任何 一 棵 二 又 树 也 能 唯一 地 对 应 一 个 
森林 或 一 棵 树 。 正 是 由 于 有 这 样 的 一 一 对 应 关系 ， 可 以 把 在 树 的 处 理 中 的 问题 对 应 到 二 又 
树 中 进行 处 理 ， 从 而 可 以 把 问题 简化 ， 因 此 ， 二 又 树 在 树 的 应 用 中 显得 特别 重要 。 下 面 将 
介绍 森林 、 树 与 二 又 树 相互 转换 的 方法 。 
对 于 一 般 的 树 来 说 ， 树 中 结 点 的 左 、 右 次 序 无 关 紧 要 ， 只 要 其 双亲 结 点 与 孩子 结 点 的 
关系 不 发 生 错误 就 可 以 了 。 但 在 二 又 树 中 ， 左 、 右 孩子 结 点 的 次 序 不 能 随意 颠倒 。 因 此 ， 
下 面 讨论 的 二 叉 树 与 一 般 树 之 间 的 转换 都 是 约定 按照 树 在 图 形 上 的 结 点 次 序 进行 的 ， 即 把 
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一 般 树 作为 有 序 树 来 处 理 ， 这 样 不 致 引起 混乱 。 

1. 树 转换 成 二 又 树 

将 一 棵 树 转 换 成 二 叉 树 的 过 程 (如 图 6.18 所 示 ) 如 下 : 对 每 个 孩子 进行 从 左 到 右 的 
排序 ，@ 在 兄弟 之 间 加 一 条 连 线 ; 每 个 务 告 点 ， 除 了 第 一 个 孩子 外 ， 去 除 其 与 其 余 孩 子 
之 间 的 联系 ，@ 以 根 结 点 为 轴 心 ， 将 整个 树 顺 时 针 转 一 定 角度 。 

这 种 转换 的 特点 是 一 棵 树 转换 成 二 又 树 后 ， 根 结 点 没有 右 孩 子 。 


(a) 树 (b) 转换 过 程 《ce 二叉树 
6.18” 树 转换 为 二 又 树 ‘ 





2， 林 林 和 转换 为 一 棵 二 又 树 


将 森林 转换 成 二 义 树 的 方法 与 一 标 权 转换 成 二 又 树 的 方法 类 似 ， 如 图 6.19 所 示 ， 只 是 
把 森林 中 所 有 树 的 根 结 点 看 作 兄 弟 关 系 ， 并 对 其 中 的 每 棵 树 依次 地 进行 转换 。 

将 森林 转换 成 二 叉 树 的 过 程 如 下 :将 各 棵 树 分 别 转 成 二 又 树 ; @ 第 一 棵 二 又 树 不 动 ， 
从 第 二 棵 二 又 树 开 始 ， 依 次 把 后 一 棵 二 又 树 的 根 结 点 作为 前 一 棵 二 又 树 根 结 点 的 右 孩 子 ; 
加 以 第 一 0 义 树 的 根 结 点 ， 按 顺 时 针 方 向 旋转 。 
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(c) 转换 过 程 2 (d) 二 叉 树 


图 6.19 森林 转换 为 二 又 树 
3. 将 二 又 树 转换 为 树 或 森林 


将 二 叉 树 转换 成 树 或 森林 的 过 程 如 下 : @D 若 某 结 点 是 其 双亲 的 左 孩子 ， 则 把 该 结 点 的 
右 孩 子 、 右 孩子 的 右 孩 子 …… 都 与 该 结 点 的 双亲 结 点 用 线 连 起 来 ; @ 删 除 原 二 又 树 中 所 有 
的 双亲 结 点 与 右 孩子 结 点 的 连 线 ，@@ 整 理 步骤 1、2 所 得 到 的 树 或 木林， 使 结构 层次 分 明 。 

将 图 6.20(a) 所 示 的 二 又 树 还 原 为 一 般 的 树 。 还 原 为 树 的 过 程 如 图 6.20(b) 所 示 ， 最 终结 


构 如 图 6.20(c) 所 示 。 
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(a) 一 叉 树 (b) 转换 过 程 (©) 一 般 的 树 
6.20 二叉树 转换 为 树 





思考 
请 思考 二 又 树 转换 为 森林 的 步骤。 


6.3.2” 树 和 森林 的 存储 表示 
1， 双 亲 表 示 法 


这 种 存储 结构 是 一 种 顺序 存储 结构 ， 用 一 组 连续 空间 存储 树 的 所 有 结 点 ， 同 时 在 每 个 结 点 

中 附设 一 个 伪 指针 指示 其 双亲 结 点 的 位 置 。 其 结 点 结构 如 图 6.21 所 示 。 
例如 ,图 6.22(a) 所 示 树 对 应 的 双亲 存储 结构 为 图 6.22(b)， 其 中 ， 
图 6.21 结 点 结构 根 结 点 R 的 双亲 伪 指 针 为 -1， 其 孩子 结 点 A、B 和 C 的 双亲 伪 指 针 














均 为 0，D 和 EE 的 双亲 伪 指 针 均 为 1,~F 的 双亲 伪 指 针 为 3，G、H 和 的 双亲 伪 指 针 均 为 6。 
下 标 数 弓 、 
2 ! 
Ce) (5) Co) 。 
\ 5 
NO (YD (9 s 
@oOe ; 








(a) 树 (b) 对 应 的 双亲 存储 结构 
6.22” 树 的 双亲 表示 法 示例 


该 存储 结构 利用 了 每 个 结 点 ( 根 结 点 除外 ) 只 有 唯一 双亲 的 性 质 。 在 这 种 存储 结构 中 ， 
求 某 个 结 点 的 双亲 结 点 十 分 容易 ， 但 求 某 个 结 点 的 孩子 结 点 时 需要 遍历 整个 结构 。 

以 下 是 双亲 表示 法 结 点 结构 定义 代码 。 

#define MAXTREESIZE 100 

typedef int TreeElemType; // 树 结 点 的 数据 类 型 ， 目 前 暂 定 为 整 型 

typedef struct PTNode // 结 点 结构 

{ 























TreeElemType data; // 结 点 数据 
int parent; // 双 亲 位 置 
}PTNode ; 





typedef struct // 树 结构 
{ 


PTNode nodes [MAXTREESIZE] 7 // 数 组 结构 

二 ryny // 根 的 位 置 和 结 点 数 
}PTree; 
2.， 孩子 表示 法 








1 于 树 中 每 个 结 点 可 能 有 多 棵 子 树 , 可 以 考虑 用 多 重 链表 , 即 每 个 结 点 有 多 个 指针 域 ， 
其 中 每 个 指针 指向 一 棵 子 树 的 根 结 点 ， 我 们 把 这 种 方法 叫 作 多 重 链表 法 。 不 过 ， 树 的 每 个 
结 点 的 度 是 不 同 的 ， 所 以 结 点 的 指针 域 个 数 的 设置 也 有 两 种 方法 : 

名 每 个 结 点 指针 域 的 个 数 等 于 树 的 度数 ; 

@ 每 个 结 点 指针 域 的 个 数 等 于 该 结 点 的 度数 。 

相应 地 ， 链 表 中 的 结 点 可 以 有 图 6.23 所 示 的 两 种 结 点 格式 。 
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图 6.23 ”孩子 表示 法 的 两 种 结 点 格式 
其 a data 是 数据 域 。 childl 到 childd 是 指针 域 (用 来 指向 该 结 点 的 孩子 结 点 )，degree 





























如 图 6.24 所 示 。 








图 6.24 ”存储 方法 1 

这 种 方法 对 于 树 中 各 结 点 的 度 相差 很 大 时 ， 显 然 是 很 浪费 空间 的 ， 因 为 有 很 多 结 点 的 
指针 域 是 空 的 。 不过， 如 果树 的 各 结 点 度 相 差 很 小 ， 那 就 意味 着 开辟 的 空间 被 充分 利用 了 ， 
这 时 存储 结构 的 缺点 反而 变 成 了 优点 。 
我 们 接着 用 方法 2 来 存储 图 6.22(a) 的 树 ， 如 图 6.25 所 示 。 























图 6.25 存储 方法 2 
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这 种 方法 克服 了 浪费 空间 的 缺点 ， 对 空间 利用 率 是 很 高 的 ， 但 是 由 了 
是 不 相同 的 结构 ， 加 上 要 维护 结 点 的 度 的 数值 ， 在 运算 上 就 会 带 来 时 间 j 

存在 既 可 以 减少 空 指针 的 浪费 又 能 使 结 点 结构 相同 的 方法 吗 ? 答案 
察 ， 我 们 为 了 要 遍历 整 棵 树 ， 把 每 个 结 点 放 到 一 个 顺序 存储 结构 的 数组 中 是 
个 结 点 的 孩子 有 多 少 是 不 确定 的 ， 所 以 ， 我 们 要 对 每 个 结 点 的 孩子 建立 一 个 
它们 的 关系 。 这 就 是 我 们 要 介绍 的 孩子 表示 法 。 


F 各 
上 的 
是 肯 








个 结 点 的 链表 
损耗 。 

定 的 。 仔 细 观 
合理 的 ， 但 每 
单 链 表 以 体现 


具体 办 法 是 把 每 个 结 点 的 孩子 结 点 排列 起 来 ， 以 单 链表 作为 存储 结构 ， 则 n 个 结 点 有 
n 个 孩子 链表 ， 如 果 是 叶子 结 点 则 此 单 链表 为 空 。 然 后 n 个 头 指针 又 组 成 一 个 线性 表 ， 采 











顺序 存储 结构 ， 存 放 进 一 个 一 维 数组 














h。 运 用 这 种 存储 方法 存储 图 6.22(a) 的 树 ， 结 果 














如 图 6.26 所 示 。 
下 标 数 组 
0 
| 
p4 
3 
4 
$ 
6 
议 
8 
9 
图 6:26"” 孩子 表示 法 示意 图 
为 此 ， 设 计 两 个 结 点 结构 元 一 个 是 孩子 链表 的 孩 竹 结 点 ， 另 一 个 是 表 头 数组 的 表 头 结 


点 ， 分 别 如 图 6.27(a) 和 图 6.27(b) 所 示 。 
Ca Ten |] 


(a) 培 了 结 点 


data firstchild 
(b) 表 头 结 点 


图 6.27 孩子 结 点 和 表 头 结 点 


其 中 ，child 是 数据 域 ， 用 来 存储 某 个 结 点 在 表 头 数组 中 的 下 标 。next 是 指针 域 ， 用 来 
存储 指向 某 结 点 的 下 一 个 孩子 结 点 的 指针 。data 是 数据 域 ， 用 来 存储 某 结 点 的 数据 信息 。 


firstchild 是 头 指 针 域 ， 用 来 存储 指向 某 结 
以 下 是 孩子 表示 法 的 结构 定义 代码 。 


typedef struct CTNode 
{ 

int child; 

struct CTNode *next; 
Chilaptr; 


typedef struct 
{ 
DataType data; 
ChildPtr firstchild; 
}CTBox; 


点 的 下 一 个 孩子 结 点 的 指针 。 


// 孩 子 链表 结 点 


// 孩 子 链表 头 结 点 


// 结 点 的 数据 元 素 
// 孩 子 链表 头 指针 


6 ey 


typedef struct // 树 结构 
{ 

CTBox nodes [MaxTreeSize]7 

Lnt nr Ee // 树 的 结 点 数 和 根 结 点 的 位 置 
} CTrees 


我 们 要 查找 给 定 结 点 的 孩子 ， 或 者 找 该 结 点 的 兄弟 ， 只 需 查找 这 个 结 点 的 孩子 单 链表 
就 可 以 了 。 该 结构 对 于 遍历 整 棵 树 也 是 很 方便 的 ， 对 头 结 点 的 数组 循环 即 可 。 

3.， 孩子 兄弟 表示 法 

任意 一 棵 树 ， 它 的 结 点 的 第 一 个 孩子 如 果 存 在 就 是 唯一 的 ， 它 的 右 兄 弟 如 果 存 在 也 是 
唯一 的 。 因 此 ， 我 们 设置 两 个 指针 ， 分 别 指向 该 结 点 的 第 一 个 孩子 和 此 结 点 的 右 兄 弟 。 这 
就 是 我 们 接 下 来 要 介绍 的 孩子 兄弟 表示 法 。 

结 点 结构 如 图 6.28 所 示 。 


| dam | firstehild | righesib 站 
图 6.28 结 点 结构 


其 中 ，data 是 数据 域 ，firstchild 为 指针 域 ， 存 储 该 结 点 的 第 一 个 孩子 结 点 的 存储 地 址 ; 
rightsib 是 指针 域 ， 存 储 该 结 点 的 右 兄 弟 结 点 的 存储 地 址 。 
这 是 一 种 常用 的 存储 结构 ， 在 这 种 存储 结构 下 ， 树 中 结 点 的 存储 表示 可 描述 如 下 





















































I < 
typedef struct CsTreeNode 、 ww 
1 y 
{ ry y bo 
DataType data; a 人 
人 


struct CsTreeNode *firstchild; bo 
struct CsTreeNode *rightsib; 一 > 
}CsNode, *CsTree; 下 A 


对 于 图 622( 的 树 来 说 ， 这 种 方法 实现 的 示意 图 如 图 6.29 所 示 。 





6.29 孩子 兄弟 表示 法 示意 图 


孩子 兄弟 表示 法 给 查找 某 个 结 点 的 孩子 带 来 了 方便 ， 因 为 只 需 通过 firstchild 找到 此 结 
点 的 长 子 ， 然 后 通过 长 子 结 点 的 rightsib 就 可 以 找到 其 他 兄弟 了 。 另 外 ， 该 表示 法 可 方便 
地 实现 树 和 二 又 树 的 相互 转换 。 但 是 这 种 表示 法 跟 孩 子 表示 法 存在 一 样 的 缺点 ， 就 是 从 当 
前 结 点 查找 双亲 结 点 比较 麻烦 ， 需 要 从 根 结 点 开始 逐个 结 点 比较 查找 。 


9 人 3 


ae ) 


ee 
6.3.3” 树 和 森林 的 人 遍历 
1， 树 的 遍历 


和 二 又 树 的 遍历 类 似 ， 树 的 遍历 问题 也 是 从 根 结 点 出 发 ， 对 树 中 各 个 结 点 进行 一 次 且 
仅 进行 一 次 访问 。 

对 树 进行 遍历 可 有 两 条 搜索 路 径 : 一 条 是 从 左 到 右 ( 这 里 的 左右 指 的 是 在 存储 结构 中 自 
然 形成 的 子 树 之 间 的 次 序 )， 另 一 条 是 按 层次 从 上 到 下 。 

树 的 按 层次 遍历 类 似 于 二 叉 树 的 按 层次 遍历 , 例如， 对 图 6.30 所 示 的 树 进行 按 层次 遍 
历 所 得 结 点 先后 被 访问 的 次 序 为 ABCDEFGHIJK。 

对 根 的 访问 时 机 不 同 可 得 下 列 两 个 遍历 树 : 

1) 先 根 ( 序 ) 遍 历 树 

车 树 非 空 ， 则 先 访问 根 结 点 ， 然 后 依次 从 左 到 右 先 根 遍历 根 的 各 棵 子 树 。 

2) 后 根 ( 序 ) 饥 历 树 \ 
车 树 非 空 ， 则 先 依次 从 左 到 右 后 根 遍 历 根 的 各 棵 子 树 , 然后 访问 根 结 点 。 

例如 ,对 图 6.30 所 示 的 树 进行 先 根 遍历 所 得 结 点 的 访问 序列 为 ABEHIJCFDGK， 进 行 
后 根 人 遍历 所 得 结 点 的 访问 序列 为 HJEBFCKGDA: 一 























图 6.30 一 棵 树 


2. 森林 的 遍历 “~ 

森林 是 树 的 集合 ， 由 此 可 以 对 森林 中 的 每 一 棵 树 依次 从 左 到 右 进 行 先 根 凯 历 或 者 后 根 
遍历 。 森 林 中 的 第 一 棵 树 的 根 、 第 一 棵 树 的 子 树 森 林 及 其 余 树 构成 的 森林 ， 分 别 对 应 为 二 
叉 树 的 根 、 二 叉 树 的 左 子 树 和 二 叉 树 的 右 子 树 。 由 此 可 如 下 定义 森林 的 这 两 种 遍历 。 

1) 先 序 遍 历 森 林 

若 森 林 非 空 ， 则 可 依 下 列 次 序 进 行 遍历 ，Q@ 访 问 森 林 中 第 一 棵 树 的 根 结 点 ，@ 先 序 遍 
历 第 一 棵 树 中 的 子 树 森林 ，@ 先 序 遍 历 除去 第 一 棵 树 之 后 剩余 的 树 构成 的 森林 。 

2) 中 序 过 历 森 林 

若 森 林 非 空 ， 则 可 依 下 列 次 序 进 行 遍历 .中 序 遍 历 第 一 棵 树 中 的 子 树 森 林 ，@ 访 问 
森林 中 第 一 棵 树 的 根 结 点 ，@ 中 序 遍 历 除去 第 一 棵 树 之 后 剩余 的 树 构成 的 森林 。 

由 森林 与 二 叉 树 之 间 转 换 的 规则 可 知 ， 当 森林 转换 成 二 叉 树 时 ， 其 第 一 棵 树 的 子 树 森 
林 转 换 成 左 子 树 ， 剩 余 树 的 森林 转换 成 右 子 树 ， 则 上 述 森 林 的 先 序 壳 历 和 中 序 凯 历 即 为 其 
对 应 的 二 又 树 的 先 序 遍历 和 中 序 遍 历 。 

由 此 可 见 ， 树 的 先 根 遍 历 即 森林 的 先 序 遍历 ， 可 对 应 到 二 又 树 的 先 序 遍历 ; 树 的 后 根 
遍历 即 森林 的 中 序 遍 历 ， 可 对 应 到 二 又 树 的 中 序 遍 历 。 换 句 话说 ， 若 以 孩子 -兄弟 链表 作为 
树 (或 森林 ) 的 存储 结构 , 则 树 的 先 根 遍 历 (或 森林 的 先 序 遍 历 ) 的 算法 和 二 又 树 的 先 序 遍历 算 
法 类 似 ， 而 树 的 后 根 志 历 ( 或 森林 的 中 序 遍 历 ) 的 算法 和 二 又 树 的 中 序 遍 历 算法 类 似 。 


QGr 











G eg 


6.4 ”线索 二 又 树 


6.4.1 ”线索 二 又 树 的 基本 概念 


二 叉 树 的 遍历 本 质 上 是 将 一 个 复杂 的 非 线性 结构 转换 为 线性 结构 ， 使 每 个 结 点 都 有 了 
唯一 前 趋 和 后 继 (第 一 个 结 点 无 前 趋 ， 最 后 一 个 结 点 无 后 继 )。 对 于 二 又 树 的 一 个 结 点 ， 查 
找 其 左右 子女 是 方便 的 ， 其 前 趋 、 后 继 只 能 在 遍历 中 得 到 。 为 了 容易 找到 前 趋 和 后 继 ， 有 
两 种 方法 : 一 是 在 结 点 结构 中 增加 向 前 和 向 后 的 指针 fwd 和 bkd， 这 种 方法 增加 了 存储 开 
销 ， 不 可 取 ; 二 是 利用 二 叉 树 的 空 链 指针 。 

对 于 具有 n 个 结 点 的 二 叉 树 ， 采 用 二 又 链 存储 结构 时 ， 每 个 结 点 有 两 个 指针 域 ， 总 共 
有 2n 个 指针 域 ， 又 由 于 只 有 n-1 个 结 点 被 有 效 指针 所 指向 (n 个 结 点 中 只 有 树 根 结 点 没有 
被 有 效 指针 所 指向 )， 则 共有 2n-(n-1)=n+1 个 空 链 域 。 

让 于 遍历 方式 不 同 ， 产 生 的 遍历 线性 序列 也 不 同 ， 做 如 下 规定 ， 当 某 个 结 点 的 左 指针 
为 空 时 ， 令 该 指针 指向 按 某 种 方式 遍历 二 叉 树 时 得 到 该 结 点 的 直接 前 趋 结 点 ， 当 某 结 点 的 
右 指针 为 空 时 ， 令 该 指针 指向 按 某 种 方式 遍历 三 叉 树 时 得 到 该 结 点 的 直接 后 继 结 点 。 但 如 
区 分 左 指针 指向 的 结 点 到 底 是 左 孩子 结 点 还 是 直接 前 趋 结 点 ， 右 指针 指向 的 结 点 到 底 是 
右 孩 子 结 点 还 是 直接 后 继 结 点 呢 ? 为 此 ”在 结 点 的 存储 结构 上 增加 两 个 标志 位 ( 左 标 志 ltag 
和 右 标志 rtag) 来 区 分 这 两 种 情况 : 

i F 表示 Ichild 指 向 左 孩 子 的 结 点 

工 表示 lchild 指 向 直接 前 趋 的 结 点 
和 | 表示 rchild 指向 右 按 子 的 结 点 

1 表示 rchild 指向 直接 后 继 的 结 点 


现 将 线索 三 又 树 的 结 点 结构 重新 定义 二 如 图 6.31 所 示 。 以 这 种 结 点 结构 构成 的 二 又 链 
表 作为 二 又 树 的 存储 结构 ， 叫 作 线索 链表 ， 指 向 前 趋 和 后 继 的 指针 叫 作 线索 ， 加 上 线索 的 二 
又 树 叫 作 线索 二 叉 树 ， 对 二 又 树 进行 某 种 形式 遍历 使 其 变 为 线索 二 又 树 的 过 程 叫 作 线索 化 ， 
即 线索 化 的 过 程 就 是 在 遍历 的 过 程 中 修改 空 指针 的 过 程 。 
lchild ltag data rtag rchild 
图 6.31 线索 二 又 树 的 结 点 结构 


和 双向 链表 结构 一 样 ， 在 二 又 树 线索 链表 上 添加 一 个 头 结 点 ， 如 图 6.32 所 示 。 该 结 点 
的 data 域 为 空 ，Ichild 域 的 指针 指向 二 又 树 的 根 结 点 (图 6.32 中 的 GD)，ltag 为 0，rchild 指 
向 按 某 种 遍历 二 叉 树 的 最 后 一 个 结 点 (图 6.32 中 的 @), rtag 为 1。 另外, 令 该 遍历 产生 序列 
的 第 一 个 结 点 的 lchild 域 指针 和 最 后 一 个 结 点 的 rchild 域 指针 均 指 向 头 结 点 (图 6.32 中 的 @ 
和 外)。 这 样 定义 的 好 处 就 是 我 们 既 可 以 从 第 一 个 结 点 起 顺 后 继 进行 遍历 ， 也 可 以 从 最 后 一 
个 结 点 起 顺 前 趋 进行 遍历 。 

图 6.32(a) 为 中 序 线索 二 又 树 ( 中 序 序列 为 DGBAECHF)， 图 6.32(b) 为 先 序 线索 二 又 树 
( 先 序 序列 为 ABDGCEFH), 图 6.32(c) 为 后 序 线索 二 又 树 ( 后 序 序列 为 GDBEHFCA)。 图 6.32 
中 的 实 线 表 示 二 又 树 原来 指针 所 指 的 结 点 ， 虚 线 表 示 线 索 二 又 树 所 添加 的 线索 。 
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(b) 先 序 线 家 村 








(©) 后 序 线索 树 
图 6.32 线索 二 又 树 
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6.4.2 ”线索 二 又 树 的 基本 操作 
线索 二 又 树 的 存储 结构 如 下 : 





1， 二 又 线索 树 的 构造 -人 
按 先 序 笨 入 二 又 线索 树 中 结 点 的 值 并 构造 二 又 线 a 中 ，# 吉 示 空 树 。 
算法 6.7 构造 线索 二 叉 树 





2 线索 二 又 树 的 中 序 遍 历 线索 化 


中 序 遍 历 二 又 树 T， 并 将 其 中 序 线索 化 ，Thrt 指向 头 结 点 。 
算法 6.8 ”线索 二 又 树 的 中 序 遍 历 


Eo 
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在 算法 6.8 中 InThreading 函数 的 虚线 框 部 分 中 , 这 !p->lchild) 表示 如 果 某 结 点 的 左 指 
针 域 为 室 ， 因 为 其 前 趋 结 点 刚刚 访问 过 ， 赋 值 给 了 pre， 所 以 可 以 将 pre 赋值 给 p->lchild， 
并 修改 p->LTag = Thread (也 就 是 定义 为 D) 以 完成 前 趋 结 点 的 线索 化 。 

后 继 就 要 稍微 麻烦 一 些 。 因 为 此 时 p 结 点 的 后 继 还 没有 访问 到 ， 因 此 只 能 对 它 的 前 趋 
结 点 pre 的 右 指针 rchild 进行 判断 。if(!pre->rehild) 表示 如 果 为 空 ， 则 p 就 是 pre 的 后 继 ， 
于 是 pre->rchild=p， 并 且 设 置 pre->RTag=Thread， 以 完成 后 继 结 点 的 线索 化 。 


Gy 
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完成 前 趋 和 后 继 的 判断 后 ， 别 忘记 将 当前 的 结 点 p 赋值 给 pre， 以 便于 下 一 次 使 用 。 
3. 中 序 遍历 二 又 线索 树 


T 为 二 又 线索 树 的 头 结 点 ， 我 们 用 非 递归 方式 来 实现 ， 具 体 代码 见 算法 6.9。 
算法 6.9 中 序 遍 历 二 又 线索 树 






其 中 , p=T->lchild 的 意思 就 是 图 6.32(a) 中 的 @, 让 p 指向 根 结 点 开始 遍历 .while(p!=T) 
的 意思 就 是 循环 直到 图 6.32(a) 中 的 四 出 现 ， 此 时 意味 着 p 指向 了 头 结 点 ， 于 是 与 相等 (T 
是 指向 头 结 点 的 指针 ), 结束 循环 ,否则 一 直 循环 下 去 进行 遍历 操作 。while(p->LTag==Link) 
这 个 循环 ， 就 是 由 A 一 B 一 D。 此 时 D 结 点 的 Ltag 不 是 Link( 即 Ltag 不 等 于 0)， 所 以 结束 
此 循环 。 此 时 指针 p 指向 D， 执 行 visit(p->data)， 输 出 D。while(p->RTag==Thread&&p-> 
rchild!=T) 是 在 Rtag 为 Thread( 即 Rtag 等 于 1) 且 p->rchild 不 指向 头 结 点 的 情况 下 执行 此 循 
环 ， 当 p 指向 D 时 ， 由 于 p->rchild 为 0， 所 以 不 执行 此 循环 。 执 行 p=p->rchild 使 p 指向 
结 点 G。 因 为 p!=T， 所 以 接着 执行 while(p!=T) 循 环 ， 直 到 依次 输出 BAECHF。 最 后 p 指 
向 了 头 结 点 ， 即 p=T， 循 环 终止。 

从 这 段 代 码 可 以 看 出 ， 它 相当 于 对 一 个 链表 的 扫描 ， 所 以 时 间 复 杂 度 为 O(n)。 由 于 它 
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充分 利用 了 空 指针 域 的 空间 (这 意味 节省 了 空间 )， 又 保证 了 创建 时 的 一 次 遍历 就 可 以 终生 
受用 前 趋 、 后 继 的 信息 (这 意味 着 节省 了 时 间 )。 所 以 在 实际 问题 中 ， 如 果 所 用 的 二 又 树 需 
经 常 遍 历 或 查找 结 点 时 需要 某 种 遍历 序列 中 的 前 趋 和 后 继 ， 那 么 采用 线索 二 又 链表 的 存储 
结构 是 非常 不 错 的 选择 。 


















































注意 
(1) 在 中 序 、 先 序 和 后 序 线索 二 又 树 中 ， 所 有 实践 均 相 同 ， 即 线索 化 之 前 的 二 又 树 
相同 ， 所 有 结 点 的 标志 位 取 值 也 完全 相同 ， 只 是 当 标 志 位 取 1 时 ， 不 同 的 线索 二 又 树 将 
用 不 同 的 虚线 表示 ， 即 不 同 的 线索 树 中 线索 指向 的 直接 前 趋 结 点 和 直接 后 继 结 点 不 同 。 
(2) 学 习 线索 化 时 ， 有 3 点 必须 注意 : 






@ 何 种 “ 序 ” 的 线索 化 ， 是 先 序 、 中 序 还 是 后 序 。 ， 
@ 要 “前 趋 ” 线 索 化 、“ 后 继 ” 线 索 化 还 是 “全 ”线索 化 (前 趋 后 继 都 要 )。 
@ 只 有 空 指针 处 才能 加 线索 。 


4. 线索 二 又 树 的 查找 


(1) 在 中 序 线索 二 又 树 中 查找 结 点 *p 的 前 趋 和 后 继 。 若 结 点 的 Ltag=1，lchild 指向 其 
前 趋 ， 和 否则 ， 该 结 点 的 前 趋 是 以 该 结 点 为 根 的 左 子 树 上 按 中 序 遍 历 的 最 后 一 个 结 点 。 若 
Rtag=1，rchild 指向 其 后 继 ; 否则 ， 该 结 点 的 后 驱 是 以 该 结 点 为 根 的 右 子 树 上 按 中 序 过 历 
的 第 一 个 结 点 。 求 后 继 和 前 趋 的 代码 分 别 见 算法 6.10 和 算法 6.11。 

算法 6.10 ”在 中 序 线索 己 又 树 上 查找 后 继 - 

BiThrTree * InorderPostNode (BiThriree *p) L E 

| p \ Wg A 

4 @ Rady return(p->rehild); 
else™{ [ BS ~ 
Sb-Srehild; ! // 找 碳 子 树 最 先 访问 的 结 点 
while (q->LTag==0) q=q->lchild; 
return(q); 





} 
算法 6.11 在 中 序 线索 二 又 树 上 查找 前 趋 


BiThrTree * InOrderPreNode (BiThrTree *p) 
{ 
if (p->LTag==1) return(p->lchild); 
else { 
q=p->lchild; // 拷 左 子 树 最 后 访问 的 结 点 
while (q->RTag==0) gq=q->rchild; 
return(q); 


} 
(2) 在 后 序 线索 二 又 树 中 查找 结 点 *p 的 前 趋 ， 车 结 点 *p 无 左 子 树 ， 则 p->lchild 指向 


O -一 


其 前 趋 。 若 结 点 *p 有 左 子 树 ， 当 其 右 子 树 为 空 时 ， 其 左 子 树 的 根 ( 即 p->lrchild) 为 其 后 序 前 
趋 ， 当 其 右 子 树 非 空 时 ， 其 右 子 树 的 根 ( 即 p->rchild) 为 其 后 序 前 趋 。 
在 后 序 线索 二 又 树 中 查找 结 点 * 的 后 继 : 若 结 点 各 为 根 ， 则 无 后 继 ; 若 结 点 部 为 其 
双亲 的 右 孩 子 ， 则 其 后 继 为 其 双亲 ; 若 结 点 *p 为 其 双亲 的 左 孩 子 ， 且 双亲 无 右 子女 ， 则 其 
后 继 为 其 双亲 ; 车 结 点 *p 为 其 双亲 的 左 孩 子 ， 且 双亲 有 右 子 女 , 则 结 点 *p 的 后 继 是 其 双亲 
的 右 子 树 中 按 后 序 遍 历 的 第 一 个 结 点 。 所 以 ， 求 后 序 线索 二 叉 树 中 结 点 的 后 继 要 知道 其 双 
杀 的 信息 ， 要 使 用 栈 ， 所 以 说 后 序 线索 二 又 树 是 不 完善 的 。 

(3) 在 先 序 线索 二 又 树 中 查找 结 点 的 后 继 较 容易 ， 而 查找 前 趋 要 知道 其 双亲 的 信息 ， 
要 使 用 栈 ， 所 以 说 先 序 线索 二 又 树 也 是 不 完善 的 。 


6.5 二 又 排序 树 







































































6.5.1 二 又 排序 树 的 基本 概念 


二 又 排序 树 (binary sort tree) 又 称 二 又 查找 (搜索 ) 树 tbinary search tree)。 其 定义 为 二 又 排 
序 树 或 者 是 空 树 ， 或 者 是 满足 如 下 性 质 的 非 空 二 又 树 : 

(1) 若 它 的 左 子 树 非 空 ， 则 左 子 树 上 所 有 结 点 的 值 均 小 于 根 结 点 的 值 。 

(2) 若 它 的 右 子 树 非 空 ， 则 右 子 树 上 所 有 结 点 的 值 均 大 于 根 结 点 的 值 。 

(3) 左 、 右 子 树 本 身 又 各 是 一 棵 三 又 排序 树 。 A 

上 述 性 质 简称 二 叉 排序 树 性 质 (BST 性 质 )， 故 二 又 排序 树 实际 上 是 满足 BST 性 质 的 二 








BST 性 质 可 知 其 特点 如 下 
(D 三 又 排序 树 中 任 一 结 点 x， 其 左 (尖子 料 中 任 一 结 点 y( 若 存在 ) 的 关键 字 必 小 (大 ) 
于 x 的 关键 字 :> 
(2) 三 又 排序 树 中 ， 各 结 点 关键 字 是 唯一 的 。 
需要 注意 的 是 ,在 实际 应 用 中 , 不 能 保证 被 查找 的 数据 集中 各 元 素 的 关键 字 互 不 相同 ， 
所 以 可 将 二 又 排序 树 定义 中 BST 性 质 (1) 里 的 “小 于 ” 改 为 “小 于 等 于 ” 或 将 BST 性 质 (2) 
里 的 “大 于 ” 改 为 “大 于 等 于 ”甚至 可 同时 修改 这 两 个 性 质 。 

G) 按 中 序 人 遍历 该 树 所 得 到 的 中 序 序列 是 一 个 递增 有 序 序列 。 
图 633 所 示 的 两 棵 树 均 是 二 又 排序 树 ， 它 们 的 中 序 序列 均 为 有 序 序列 ，2，3，4，5，7，8。 





























(2 
© @ 
3 0) 
YD VW ORG 
(a) 高 度 为 3 (b) 高 度 为 5 


6.33 ”两 棵 二 又 排 序 树 
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6.5.2 ”二 叉 排 序 树 的 生成 


设 已 知 一 组 待 排序 的 数据 ， 若 要 构造 出 对 应 的 一 个 二 叉 排 序 树 ， 一 般 采 取 从 空 树 开始 
陆续 插入 一 系列 结 点 的 办 法 ， 逐 步 生成 对 应 的 二 又 排序 树 。 即 首先 以 第 1 个 数据 构成 根 结 
点 ， 以 后 对 应 每 个 数据 插入 一 个 结 点 ， 在 插入 过 程 中 ， 原 有 结 点 的 位 置 均 不 再 变动 ， 只 是 将 
新 数据 结 点 作为 一 个 端 结 点 插入 到 合适 的 位 置 处 ,使 树 中 任何 结 点 的 数据 与 其 左 、 右 子 树 结 
点 数据 之 间 的 关系 都 符合 二 叉 排 序 树 的 要 求 。 例 如 ， 车 竺 排序 的 数据 为 一 组 正 整数 ， 即 

{12, 17, 22, 7, 12, 32, 11, 9} 

首先 以 第 1 个 数据 “12” 作 为 整个 树 的 根 结 点 ， 以 后 的 数据 均 作为 它 的 子孙 结 点 ， 其 
中 ， 数 值 小 于 12 的 结 点 应 置 于 根 结 点 的 左 子 树 ， 否 则 置 于 它 的 右 子 树 ， 第 2 个 数据 “17” 
与 根 结 点 数据 相 比 ， 数 值 比 根 结 点 数值 大 ， 相 应 的 结 点 应 是 根 结 点 的 右 儿子 结 点 ; 第 3 个 
数据 “22” 既 比 根 结 点 数据 值 大 ， 也 比 它 的 右 儿 子 结 点 的 数据 值 “17” 大 ， 故 它 是 “17” 
结 点 的 右 儿子 结 点 ; 数据 “7” 比较 容易 处 理 ， 因 为 它 比 根 结 点 数据 值 小 ， 且 根 结 点 尚 无 左 
子 树 ， 故 该 结 点 作为 根 结 点 的 左 儿 子 结 点 ; 再 下 一 个 数据 “12” 比 根 结 点 的 数值 大 (相等 也 
算 作 大 )， 但 比 根 结 点 的 右 儿子 结 点 数值 “17” 小 关 此 结 点 作为 数值 “17” 结 点 的 左 儿 子 结 
点 ; 依次 进行 下 去 ， 直 到 最 后 一 个 数据 “9 全 它 比 根 结 点 数值 小 ， 比 根 结 点 左 儿 子 结 点 数 
值 “7” 大 ， 又 比 “7” 的 右 儿子 结 点 “11” 数值 小 ， 故 此 结 点 应 是 “11” 的 左 儿子 结 点 。 


整个 过 程 的 各 个 步骤 如 图 634 所 示 。、 
(2 
DG 
G) 2 
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(a) 选 根 结 点 《b) 岳 入 结 点 17 (ce) 捅 入 结 点 22 (d) 括 入 结 点 7 (e) 捅 入 结 点 12 
GN (2 (2 
(OD 妈 () (7 QW 
0) 2 QW (2) 2 (0D (2 2 
©2 ©2 @ ® 
(f) 插入 结 点 32 (g) 插入 结 点 1 (h) 插入 节 后 一 个 结 点 9 


图 6.34 二 又 排序 树 的 生成 过 程 


6.5.3 ”二 叉 排 序 树 的 插入 


二 叉 排序 树 是 一 种 动态 树 表 。 其 特点 是 树 的 结构 通常 不 是 一 次 生成 的 ， 而 是 在 查找 过 
程 中 ， 当 树 中 不 存在 关键 字 等 于 给 定 值 的 结 点 时 再 进行 插入 。 新 插入 的 结 点 一 定 是 一 个 新 
添加 的 叶子 结 点 ， 并 且 是 查找 不 成 功 时 查找 路 径 上 访问 的 最 后 一 个 结 点 的 左 孩 子 或 右 孩子 
结 点 。 其 插入 代码 见 算法 6.12。 


Gr 























算法 6.12 ”二 又 树 的 插入 





其 中 ， Sa 浊 =X 扫 5 着 归 查找 函数 ， Ra 
6.5.4 二 又 排序 树 的 删除 ， 党 2 ,党 


对 于 一 般 的 二 又 树 ? 人 去 村 中 的 一 个 ea 因为 它 将 使 以 被 删除 的 
结 点 为 根 的 子 树 变 成 森林 破坏 了 整 棵 树 的 结构 > 但 是 对 于 二 又 排序 树 ， 删 去 树 上 的 一 个 
结 点 相当 于 Neal 在 删除 某 个 结 点 后 不 改变 二 又 树 的 特性 即 可 。 
在 二 区 一 个 结 点 的 代码 见 算法 6.13。 

算法 6.13” 二 叉 排序 树 的 删除 
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6.6 应 用 实践 


6.6.1 ”等 价 类 问题 
1， 等 价 类 问题 中 的 相关 概念 


等 价 关系 (equivalence relation): 假定 有 一 个 具有 mn 个 元 素 的 集合 U={1, 2,…, n}, 男 有 一 个 
有 具有 r 个 关系 的 集合 R={(i1, jD, (io, jb),…,(in 让}。 关 系 尺 是 一 个 等 价 关 系 ， 当 上 且 仅 当 如 下 条 件 
为 真 时 成 立 ，@ 对 于 所 有 的 a， 有 (a, a) ER 时 ， 即 关系 是 自 反 的 ; @ 当 且 仅 当 (b, a) ER 时 (a, b) 
ER， 即 关系 是 对 称 的 ，@) 若 (a, b)ER 且 (b, c)eR， 则 有 (a, c)eR， 即 关系 是 传递 的 。 

等 价 类 : 设 R 是 集合 S 的 等 价 关 系 ， 对 任何 xES， 集 合 [xJr={y| yeS, xRy} 称 为 由 x 
生成 的 一 个 R 等 价 类 。R 可 产生 集合 S 的 唯一 划分 ,， 即 可 以 按 及 将 S 划分 为 若干 不 相交 的 
子 集 S1, S2, …, 这 些 子 集 Si 称 为 S 的 R 等 价 类 。 简 言 之 , 若 (a, bjER, 则 元 素 a 和 b 等 价 。 
等 价 类 是 集合 中 相互 等 价 的 元 素 的 最 大 子 集合 。 

等 价 类 问题 是 指 能 够 归结 为 按 给 定 的 等 价 关 系 划 分 某 集合 为 等 价 类 的 应 用 问题 。 


© sy 
2.， 划分 等 价 类 的 算法 思 


问题 的 描述 : 假设 集合 S 有 nm 个 元 素 ，m 个 形 如 (x, y)(x, ye S) 的 等 价 偶 对 确定 了 等 价 
关系 R， 需 求 S 的 划分 。 

其 算法 实现 步骤 表述 如 下 : 

(1) 令 S 中 每 个 元 素 各 自 形成 一 个 只 含 单 个 元 素 的 子 集 ， 记 为 Su Ss, …, Sn。 

(2) 依次 扫描 m 个 偶 对 ， 对 每 个 扫描 的 偶 对 (x, y)， 判 定 x* 和 y 所 属 的 子 集 。 假设 xE 
Si，yESi， 若 Si 入 Sij， 则 将 Si 并 入 Si 并 置 Si 为 空 (或 将 S; 并 入 Si 并 置 Si 为 空 )。 当 m 个 偶 
对 都 被 处 理 后 ，S1，S，，…,Ss 中 所 有 非 空 子 集 即 为 $ 的 R 等 价 类 。 

3. 划分 等 价 类 中 的 基本 操作 及 实现 

由 上 述 算法 可 见 ， 划 分 等 价 类 对 集合 S( 其 中 Si1US2U…USs = S, SiES, i=1, 2, *…, n) 
的 操作 主要 有 3 个 : 

(1) void initial(MFSet &S, int m, DataType *x): 初始 化 操作 ， 条 造 一 个 由 m 个 子 集 (每 
个 子 集 只 含 单个 元 素 x[ 让 构成 的 集合 S。 

(2) int find_mfset(MFSet S, int ): 判定 某 个 单元 素 x[i] 所 在 的 子 集 S。 

(3) int merge_mfset(MFSet &S, int i, intj): 明 沐 现 个 互 不 相交 的 非 空 集合 Si 和 S;, 将 其 
中 一 个 并 入 另 一 个 中 。 

以 上 3 个 操作 都 是 对 集合 进行 的 操作 。 而 电 首先 确定 集合 这 种 数据 类 型 的 实现 方法 。 
集合 的 实现 方法 有 位 向 量 表示 法 、 有 序 表 表示 法 和 树 形 结构 表示 法 等 。 选 择 哪 种 表示 法 主 
要 取决 于 该 集合 的 大 小 及 对 该 集合 进行 的 操作 。 根 据 划分 等 价 类 问题 中 集合 的 特点 和 find、 
merge 操作 的 特点 ， 选 择 利用 树 形 结构 表示 集合 

在 此 约定 以 森林 F=(Tr;T2, …, Tr) 表示 集合 'S7 森 林 中 的 每 一 棵 树 Tii =1, 2,…, n) 表 示 S 
中 的 一 个 子 集 Si(SiES, 汪 1,2,…,n), 树 中 每 个 结 点 表示 子 集中 的 一 个 元 素 x。 另 外 ,每 个 结 
点 中 包含 一 个 指向 其 双亲 的 指针 ， 并 约定 根 结 点 的 元 素 值 为 所 在 子 集 的 名 称 。 

基于 上 述 约定 ， 对 于 查找 操作 的 实现 ， 只 要 从 该 元 素 结 点 出 发 ， 顺 着 指向 双亲 的 指针 
查找 ， 直 到 找到 该 元 素 所 在 树 的 根 结 点 为 止 ， 对 于 合并 操作 的 实现 ， 只 要 将 一 棵 子 集 树 的 
根 指向 另 一 棵 子 集 树 的 根 即 可 。 例 如 ， 图 6.35(a) 和 图 6.35(b) 中 的 两 棵 树 分 别 表示 子 集 
SI={1,3,5,7} 和 Ss={2,4,6}， 可 以 说 元 素 1,3,5,7 在 以 1 为 根 的 子 集中 ， 元 素 2,4,6 在 以 2 为 
根 的 子 集 中 。 图 6.35(c) 实 现 了 S3=S1US,。 可 见 约定 中 的 树 形 结构 易于 实现 集合 的 查找 与 
合并 的 操作 。 其 实现 代码 详 见 算法 6.14 一 算法 6.16。 
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(a) 集合 Si (b) 集合 S> (c) 集合 Ss=S1U 5; 


图 6.35 ”集合 合并 前 后 示意 图 
为 了 便于 操作 的 实现 ， 树 形 结构 采用 双亲 表示 法 表示 存储 结构 。 


只 
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1) 初始 化 操作 的 实现 

在 初始 化 的 过 程 ， 集 合 S 中 有 m 个 子 集 ， 每 个 子 集 只 含有 一 个 元 素 ， 分 别 为 x[1], 
X[2]，…, x[m] 。 

算法 6.14 ”初始 化 操作 的 实现 





2) 确定 集合 S 中 元 素 x 中 所 属 子 集 的 根 A 
算法 6.15 确定 集合 中 元 素 [所 届 子 集 的 根 一 





3) 求 并 集 SUS WL 
在 求 并 集 的 过 程 中 ，S.n6des[ij S ote S 的 互 不 相交 的 两 个 子 集 Si 和 Si 的 


上 灾 
算法 sy SiUSi % 





通过 上 面 代码 ， 我 们 知道 ， 算 法 find_mfset 和 merge_mfset 的 时 间 复 杂 度 分 别 为 O(d) 
和 O(1)。 其 中 d 是 树 的 深度 ， 其 值 和 树 的 形成 过 程 有 关 。 


如 由 





以 上 x[j] 取 值 为 ij， 为 方便 起 见 ， 下 面 直接 以 1 表述 相应 结 点 。 

(1) 最 坏 的 情况 . 当 集 合 S 有 n 个 子 集 S1, Ss,…,Sn, 且 每 个 子 集 只 有 一 个 成 员 S={i} (=1， 
2,…, n)， 由 n 棵 只 有 一 个 根 结 点 的 树 表示 。 如 图 6.36(a) 所 示 。 现 进行 n-1 次 合并 操作 ， 并 
假设 每 次 都 是 含 元 素 多 的 根 结 点 指向 含 元 素 少 的 根 结 点 , 则 最 后 得 到 的 集合 树 的 深度 为 n， 
如 图 6.36(b) 所 示 。 若 假设 每 次 合并 后 都 要 进行 查找 元 素 “1” 的 操作 ， 则 全 部 操作 的 时 间 复 杂 


Gy 


6 | 


度 为 Oo。 改进 合并 /查找 算法 性 能 的 办 法 是 根据 “重量 规则 ”或 “高 度 规则 ”进行 合并 操作 。 
重量 规则 若 树 i 结 点 数 少 于 树 j 结 点 数 ， 将 j 作为 i 的 父 结 点 ， 否 则 将 i 作为 j 的 父 结 点 。 
高 度 规则 : 车 树 i 的 高 度 小 于 树 j 的 高 度 , 将 j 作为 i 的 父 结 点 , 否则 将 i 作为 j 的 父 结 点 。 























SiUS2US, 
SIUSzUS; 
SIUS， 
OOOO O 
(a) n 棵 单 结 点 树 (b) n=1 合 并 操作 


图 6.36 结 点 合并 示意 图 、 


以 按照 “重量 规则 ” 对 合并 算法 进行 改进 为 例 、 为 此 ， 需要 修改 相应 的 存储 结构 : 令 
根 结 点 的 parent 域 存储 子 集中 所 含 元 素数 目的 负 值 。 合 并 改进 算法 见 算法 6.17。 其 中 
Sunodes[] 和 Snodes[] 分 别 为 $ 的 互 不 相交 的 三 个 子 集 Si 和 Sj 的 根 结 点 ， 求 并 集 SIU Si。 

算法 6.17 合并 算法 的 改进 FE 

void mix mfset(MFSet &S, int ne 3 用 下 

{ YA rN 




















\ 所 A 
if(i<1 i>s.n|j<1lj>s.n) return ERROR; -3 
ee > //si 所 含 元 素 比 Sj 少 
{ < > 
.snodes0j .parent += S.nodes [i] .parent 
S.noges [i] .parent=j; 
elsef 
S.nodes[i] .parent += S.nodes[j] .parent; 
S.nodes[j] .parent = i; 
} 
return OK; 
} 


图 6.36(a) 所 示 的 n 个 子 集合 按照 “重量 规则 ”经 过 n-1 次 合并 后 如 图 6.37 所 示 ， 其 每 
次 合并 后 查找 元 素 “1” 的 时 间 复 杂 度 变 为 O(n)。 
SIUS: SIUS;US; 





























图 6.37 按 重 量规 则 进行 n-1 次 合 
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操作 需 花费 的 时 间 也 不 断 增 大 。 为 改善 此 种 情况 ， 当 所 需 确定 的 元 素 i 不 在 树 的 第 二 层 时 
可 通过 “压缩 路 径 ” 功 能 缩短 元 素 到 达 根 结 点 的 路 径 。 
“压缩 路 径 ” 的 实现 包括 以 下 3 种 方法 。 
GD 路 径 紧 凑 (path compaction): 将 所 有 从 根 到 元 素 i 路径 上 的 元 素 都 变 成 根 的 孩子 。 
@) 路 径 分 割 (path splitting): 将 所 有 从 根 到 元 素 i 路 径 上 的 元 素 (除根 和 其 子 结 点 ) 的 
parent 域 值 变 为 其 各 自 的 祖父 结 点 。 
图 路 径 对 折 (path halving): 将 所 有 从 根 到 元 素 i 路径 上 每 隔 一 个 结 点 (除根 和 其 子 结 点 ) 的 
parent 域 值 变 为 其 各 自 的 祖父 结 点 。 在 路 径 对 折 中 ，parent 域 改 变数 仅 为 路 径 分 割 中 的 一 半 。 
例如 ， 在 图 6.38(a) 中 ， 要 确定 元 素 13 所 在 的 子 集 ， 经 过 路 径 紧凑 变换 后 如 图 6.38(b) 
所 示 ， 经 过 路 径 分 割 变换 后 如 图 6.38(c) 所 示 ， 经 过 路 径 对 折 变 换 后 如 图 6.38(d) 所 示 。 


























© 
@ 总 
QO © 站 
DDED NOAADR 
TOD OOO0O 
(a) 样 树 (b) 路 径 紧 疾 挛 换 
Q 
@ :人 笑 - 人 
QTOVOO 
CRO 
(©) 路 答 分 串 变 换 (d) 路 答对 折 变 换 
图 6.38 ”压缩 路 径 举例 
这 里 我 们 只 介绍 带 “ 路 径 紧凑 ”功能 的 确定 元 素 所 在 子 集 的 实现 ， 详 见 算法 6.18。 





算法 6.18 ”确定 元 素 所 在 子 集 


int compaction mfset(MFSet &S,int i) 
{ 
// 确 定 主 所 在 子 集 ， 并 将 从 i 至 根 路 径 上 所 有 结 点 变 为 根 的 孩子 结 点 
if(i<1 ||i>s.n)return-1; //i 不 是 s 中 的 任何 子 集 的 元 素 
for(j=i;S.nodes [j] .parent>0;j=S.nodes [j] .parent); 
for(k=i;k !=j;k=t){ 
t=S.nodes [k] .parent; 
S.nodes [k] .parent=j; 


return j; 


} 


6.6.2 ”最 优 二 叉 树 ( 哈 夫 曼 树 ) 














在 实际 应 用 中 ， 常 常 要 考虑 
算法 的 效率 最 高 。 

现 以 铁 球 分 类 问题 讨论 这 个 问题 。 有 一 批 球磨 机 上 的 铁 球 ， 需 要 将 它 分 成 4 类 : 直径 
不 大 于 20 的 属于 第 一 类 ， 直 径 大 于 20 而 不 大 于 50 的 属于 第 二 类 ， 直 径 大 于 50 而 不 大 于 
100 的 属于 第 三 类 ， 其 余 的 属于 第 四 类 ; 假定 这 批 球 中 属于 第 一 、 第 二 、 第 三 、 第 四 类 铁 
球 的 个 数 之 比例 是 1 : 2 : 3 : 4。 

我 们 可 以 把 这 个 判断 过 程 表示 为 图 6.39 所 示 的 两 种 方法 。 











个 问题 : 如 何 设计 一 棵 二 又 树 ， 使 得 执行 路 径 最 短 ， 即 








(9) 方法 一 (b) 方 法 
图 6.39 判断 二 又 树 示意 图 
池 么 究竟 将 这 个 判断 过 程 表示 成 哪 一 个 判断 框 ， 才 能 使 其 执行 时 间 最 短 呢 ? 让 我 们 对 
上 述 判断 框 进行 具体 的 分 析 。 
假设 有 1000 个 铁 球 ， 则 各 类 铁 球 的 个 数 分 别 为 00、200、300、400。 对 于 图 6.39(a)、 
图 6.39(b) 比 较 的 次 数 分 别 见 表 6-1。 


表 6-1 两 种 判断 二 叉 树 方法 的 比较 次 数 












































6.39(a) 6.39(b) 
序号 “| ”比较 式 序号 比较 式 比较 次 数 
1 | a<20 1 a>100 1000 
2 | a<so 2 a>50 600 
3 | a<io% 3 a>20 300 
合计 合计 1900 
经 过 上 述 分 析 可 知 , 图 6.39(b) 所 示 的 判断 框 的 比较 次 数 远 远 小 于 图 6.39(a) 所 示 的 判断 
框 的 比较 次 数 。 为 了 找 出 比较 次 数 最 少 的 判断 框 ， 将 涉及 树 的 ( 带 权 ) 路 径 长 度 问题 。 





那么 什么 是 二 又 树 的 带 权 路 径 长 度 呢 ? 
我 们 知道 ， 一 棵 最 优 二 叉 树 ， 也 称 哈 夫 曼 (Huffinan) 树 ， 是 指 对 于 一 组 带 有 确定 权 值 的 


os 
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ee 
叶子 结 点 ， 构 造 的 具有 最 小 带 权 路 径 长 度 的 二 又 树 。 

在 前 面 我 们 介绍 过 路 径 和 结 点 的 路 径 长 度 的 概念 ， 而 二 又 树 的 路 径 长 度 则 是 指 由 根 结 
点 到 所 有 叶子 结 点 的 路 径 长 度 之 和 。 如 果 二 又 树 中 的 叶子 结 点 都 具有 一 定 的 权 值 ， 则 可 将 
这 一 概念 加 以 推广 。 设 二 又 树 具 有 个 带 权 值 的 叶子 结 点 ， 那 么 从 根 结 点 到 各 个 叶子 结 点 
的 路 径 长 度 与 相应 结 点 权 值 的 乘积 之 和 叫 作 二 又 树 的 带 权 路 径 长 度 ， 通 常 记 作 
WPL= 》 WAL 。 其 中 Wi 为 第 k 个 叶子 结 点 的 权 值 ，Lk 为 第 k 个 叶子 结 点 的 路 径 长 度 。 

k=1 


























如 图 6.40 所 示 的 二 叉 树 ， 它 的 带 权 路 径 长 度 值 WPL=2x2+4x2+5x2+3x2=28。 


图 6.40 一 个 带 权 二 又 树 ， 


给 定 一 组 具有 确定 权 值 的 叶子 结 点 ， 可 以 构造 出 不 同 的 带 权 二 叉 树 。 例 如 ， 给 出 4 个 
叶子 结 点 ， 设 其 权 值 分 别 为 1、3、5、7， 我 们 可 以 构造 出 形状 不 同 的 多 个 二 又 树 。 这 些 形 
状 不 同 的 三 叉 树 的 带 权 路 径 长 度 将 各 不 相同 ,图 6.41 给 出 了 其 中 5 个 不 同形 状 的 二 又 树 。 

这 5 棵 树 的 带 权 路 径 长 度 分 别 如 下 5 

(1) 在 图 6.41(a) 中 ，WPL=1x243x2+5x2+7x2=32。、 

(2) 在 图 6.41(b) 中 ，WPL=<1X313x3+5x2+7x1=29。 

(3) 在 图 6.41(e) 中 ,WPL=1x2+3x3+5x3+7x1=33。 
图 
图 











(4) 在 图 6.41(d) 中 ，WPL=7x3+5x3+3x2+1x1=43。 
(5) 在 图 6.41(e) 由 ，WPL=7x1+5x2+3x3+1x3=29。 














(©) WPL=33 (d) WPL=43 (e) WPL=29 
图 6.41 具有 相同 叶子 结 点 不 同 带 权 路 径 长 度 的 二 叉 树 


此 可 见 ， 由 相同 权 值 的 一 组 叶子 结 点 所 构成 的 二 又 树 有 不 同 的 形态 和 不 同 的 带 权 路 





























径 长 度 ， 那 么 ， 如 何 找到 带 权 路 径 长 度 最 小 的 二 又 树 ( 即 哈 夫 曼 树 ) 呢 ? 根据 哈 夫 曼 树 的 定 


[Js 


6 i 


义 ， 一 棵 二 叉 树 要 使 其 WPL 值 最 小 ， 必 须 使 权 值 越 大 的 叶子 结 点 越 靠近 根 结 点 ， 而 权 值 
越 小 的 叶子 结 点 越 远离 根 结 点 。 

那么 ， 如 何 构造 哈 夫 曼 树 呢 ? 哈 夫 曼 最 早 于 1952 年 提出 了 一 个 带 有 一 般 规律 的 算法 ， 
俗称 哈 夫 曼 算法 。 具 体 如 下 : 

(1) 由 给 定 的 n 个 权 值 {wi,w2,…,wn} 构 造 n 棵 只 有 一 个 叶子 结 点 的 二 叉 树 ， 从 而 得 到 
一 个 二 叉 树 的 集合 F={T1,T2,…，Ta}; 其 中 每 棵 二 又 树 T; 中 只 有 一 个 带 权 为 wi 的 根 结 点 ， 
其 左 、 右 子 树 均 空 。 

(2) 在 F 中 选取 根 结 点 的 权 值 最 小 和 次 小 的 两 棵 二 又 树 作为 左 、 右 子 树 构造 一 棵 新 的 
二 叉 树 ， 这 棵 新 的 二 叉 树 根 结 点 的 权 值 为 其 左 、 右 子 树 根 结 点 权 值 之 和 。 
(3) 在 集合 F 中 删除 作为 左 、 右 子 树 的 两 棵 二 又 树 ， 并 将 新 建立 的 二 又 树 加 入 到 集合 F 中 。 
(4) 重复 步骤 (2)(3), 当下 中 只 剩 下 一 棵 二 又 树 时 , 这 棵 二 又 树 便 是 所 要 建立 的 哈 夫 曼 树 。 
图 6.42 给 出 了 叶子 结 点 权 值 集合 为 W={1.3,5,7} 的 哈 夫 曼 树 的 构造 过 程 。 可 以 计算 出 
其 带 权 路 径 长 度 为 29， 由 此 可 见 ， 对 于 同一 组 给 定 叶 子 结 点 所 构造 的 哈 夫 曼 树 ， 树 的 形状 
可 能 不 同 ， 但 带 权 路 径 长 度 值 是 相同 的 ， 一 定 是 最 小 的 。 


4 
第 一 步 -第 一 步 


















































第 = 步 
图 6.42 ” 险 夫 曼 树 的 建立 过 程 
1. 哈 夫 曼 树 的 构造 

















总 体 来 说 ， 我 们 是 用 数组 形式 来 设计 哈 夫 曼 树 的 。 定 义 一 个 结构 数组 ， 存 储 2n-1 个 
结 点 的 值 ， 包 括 权 值 、 父 结 点 、 左 结 点 和 右 结 点 等 。 数 组 生成 树 以 后 再 进行 哈 夫 曼 编 码 。 

定义 各 结 点 类 型 ， 其 中 应 包含 两 类 数据 ， 即 权重 域 和 指针 域 ， 而 指针 域 中 应 该 包括 指 
向 左右 孩子 和 指向 双亲 的 指针 ， 这 里 分 别 用 lchild、rdhild 和 parent 来 表示 。 因 此 ， 可 
态 三 又 链表 来 实现 ， 在 实际 构造 中 由 于 由 叶子 结 点 来 构造 新 的 根 结 点 ， 其 构造 过 程 中 仅 
叶子 结 点 的 权重 有 关 而 与 其 数据 域 无 关 ， 所 以 构造 过 程 中 不 用 考虑 其 数值 域 ， 并 且 在 链 
中 从 叶子 开始 存放 ， 然 后 不 断 地 将 两 棵 最 小 权 值 的 子 树 合并 为 一 棵 权 值 为 其 和 的 较 大 的 
树 ， 逐 步 生成 各 自 内 部 结 点 直到 树 根 。 下 面 给 出 哈 夫 曼 树 的 构造 算法 ， 详 见 算法 6.19。 






































由 商业 澡 
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算法 6.19 ” 哈 夫 曼 树 的 构造 





m2=(h+j)->weight; 
m2 pos=j; 
. 
} 
(ht+leaves+i)->parent=-1; 
(htleaves+i)->LChild=ml pos; 
(htleaves+i)->RChild=m2_ pos; 
(ht+ml_pos)->parent=leavest+ti; 
(ht+m2_pos)->parent=leavesti; 
(h+leaves+i)->weight=m2+ml17 
1 
和 


2. 哈 夫 曼 编码 


// 生 成 新 根 ， 无 双亲 

// 新 根 左 孩子 在 数组 中 的 下 标 
// 新 根 右 孩子 在 数组 中 的 下 标 
// 原 根 的 父亲 位 置 

// 原 根 的 父亲 位 置 


哈 夫 曼 编码 是 一 种 可 变 长 编码 方式 ， 是 二 叉 树 的 一 种 特殊 转化 形式 。 编 码 的 原理 是 将 


使 用 次 数 多 的 代码 转换 成 长 度 较 短 的 
持 编码 的 唯一 页 






代码 ， 而 使 用 次 数 少 的 可 以 使 用 较 长 的 编码 ， 并 且 保 


在 数据 通信 中 经 常 需 要 将 传送 的 文字 转换 成 由 三 进 制 字符 0、1 组 成 的 二 进 制 串 ， 我 
门 称 之 为 编码 。 例 如 ， 假 设 要 传送 的 电文 为 ABACCDA， 电 文中 只 含有 A、B、C、D 这 4 


种 
000， 长 度 为 21。7 
能 短 ， 显 然 ， 这 
月 此 编码 对 上 述 电 文 
案 中 ，4 种 字符 的 编码 均 为 两 位 ， 是 
让 出 现 妖 9 字符 采用 尽 可 能 短 闻 


字符 ， 若 这 4 种 字符 采用 图 6.43( 






方案 产生 前 











不 等 长 编码 ， 则 
上 述 电 文 的 











吕 


; 


送 电 文 时 , ,我 们 总 是 希望 传送 时 间 尽 可 能 短 ， 这 训 
电文 代码 不 够 短 。 图 643(b) 所 示 为 另 一 种 编码 方案 ， 
行 编码 所 建立 的 代码 为 00010010101100, 长 度 为 14。 在 这 种 编 

-种 等 长 编码 ; > 如 果 在 编码 时 考虑 字符 
编码 , 出 现 频 率 低 的 字符 采用 稍 长 的 编码 ， 构 造 


a) 所 示 的 编码 ， 则 电文 的 代码 为 000010000100100111 


要 求 电文 代码 尽 


要 





冯 方 


-种 


电文 的 代码 就 可 能 更 短 。 如 当 字 符 A、B、C、D 采用 图 6.43(c) 所 示 的 编码 
代码 为 011001010110， 长 度 仅 为 13。 








(b) 方案 2 








C 001 
D 10 


(d) 方案 4 


(0) 方案 3 


图 6.43 字符 的 四 种 不 同 的 编码 方案 





哈 夫 曼 树 可 
的 字符 集合 为 fdi，d， 
以 di，d，…，d 作为 叶子 结 点 ，w1，wW2，… 
规定 哈 夫 曼 树 中 的 左 分 支 代 表 0, 右 分 支 代表 1 








…，dn}， 它 们 在 电文 中 








于 构造 使 电文 的 编码 总 长 最 短 的 编码 方案 。 具 体 做 法 如 下 : 设 需 要 编码 


H 现 的 次 数 或 频率 集合 为 Twl，w2， 


ww， 


，wn 作 为 它们 的 权 值 ， 构 造 一 棵 哈 夫 曼 树 ， 


， 则 从 根 结 点 到 每 个 叶子 结 点 所 经 过 的 路 径 





分 支 组 成 的 0 和 1 的 序列 便 为 该 结 点 对 应 字符 
在 哈 夫 曼 编 码 树 





之 和 ， 也 就 是 电文 的 代码 总 长 。 所 以 采用 哈 夫 曼 树 构造 的 编码 是 一 种 能 使 和 


的 编码 ， 我 们 称 为 哈 夫 曼 编码 。 


Ph， 树 的 带 权 路 径 长 度 的 含义 是 各 个 字符 的 码 长 与 其 出 现 次 数 的 乘积 





电文 代码 总 长 最 
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短 的 不 等 长 编码 。 
在 建立 不 等 长 编码 时 ， 必 须 使 任何 一 个 字符 的 编码 都 不 是 另 一 个 字符 编码 的 前 级 (前 
级 编码 )， 这 样 才能 保证 译 码 的 唯一 性 。 例如， 对 于 图 6.43(d) 所 示 的 编码 方案 , 字符 A 的 
编码 01 是 字符 B 的 编码 010 的 前 级 部 分 ， 这 样 代码 串 0101001， 既 是 AAC 的 代码 ， 也 
是 ABA 和 BDA 的 代码 ， 因 此 ， 这 样 的 编码 不 能 保证 详 码 的 唯一 性 ， 我 们 称 之 为 具有 二 
义 性 的 译 码 。 
to dasa ne ed 因为 ， 在 哈 夫 曼 树 中 ， 
每 个 字符 结 点 都 是 叶子 结 点 ， 它 们 不 可 能 在 根 结 点 到 其 他 字符 结 点 的 路 径 上 ， 所 以 一 个 字 
WO 从 而 保证 了 译 码 的 非 义 性 。 
为 了 不 等 长 编码 不 是 前 级 编码 ， 可 用 该 字符 集中 的 每 个 字符 作为 叶子 结 点 生成 一 棵 编 
码 二 叉 树 ， 为 了 获得 传送 电文 的 最 短 长 度 ， 可 将 每 个 字符 的 出 现 频率 作为 字符 结 点 的 权 值 
赋予 结 点 ， te te ara ed 
送 电文 的 最 短 长 度 问题 就 转化 为 求 由 字符 集中 的 所 有 字符 作为 叶子 结 ， 由 字符 的 出 现 频 
率 作为 其 权 值 所 产生 的 哈 夫 曼 树 的 问题 。 
例如 ， 假 定 电文 中 只 使 用 A、B、C、D、E、F 这 6 种 字符 ， 若 进行 等 长 编码 ， 它 们 分 
别 需要 3 位 二 进 制 字符 ， 可 依次 编码 为 000、001w010、011、100、101。 
常识 可 知 ， 电 文中 的 每 个 字符 的 出 现 频率 一 般 是 不 同 的 。 假 定 在 一 份 电文 中 ， 这 6 
个 字符 的 出 现 频率 分 别 为 4、2、 6、8、3、2， 则 电文 被 编码 后 的 总 长 度 
L=3x(4+2+6+8+3+2)=75。 
根据 前 面 所 讨论 的 例子 ， 生成 移 编码 哈 夫 曼 树 如 图 各 所 示 。 其 中 ，A、B、C、D、 
E、F 这 6 个 字符 的 哈 夫 曼 编码 分 别 是 00、1110、01..10. 110、1111。 电 文 的 最 短 传送 长 
度 为 L=WPL=4x2+2x4+6x2+8x2+3x3+2x4=61 信 显然 ; 这 要 比 等 长 编码 所 得 到 的 传送 总 长 
度 75 要 小 得 多 。 

























































































下 面 讨论 实现 哈 夫 曼 编码 的 算法 。 实 现 哈 夫 曼 编码 的 算法 可 分 为 两 大 部 分 : 

(1) 构造 哈 夫 曼 树 ; 

(2) 在 哈 夫 曼 树 上 求 叶子 结 点 的 编码 。 

求 哈 夫 曼 编码 ， 实 质 上 就 是 在 已 建立 的 哈 夫 曼 树 中 ， 从 叶子 结 点 开始 ， 沿 结 点 的 双亲 
链 域 回 退 到 根 结 点 ， 每 回 退 一 步 ， 就 走 过 了 哈 夫 曼 树 的 一 个 分 支 ， 从 而 得 到 一 位 哈 夫 曼 码 
值 。 由 于 一 个 字符 的 哈 夫 曼 编码 是 从 根 结 点 到 相应 叶子 结 点 所 经 过 的 路 径 上 各 分 支 所 组 成 
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的 0、1 序列 ， 所 以 先 得 到 的 分 支 代码 为 所 求 编码 的 低位 码 ， 后 得 到 的 分 支 代码 为 所 求 编码 
的 高 位 码 。 因 此 ， 可 用 一 维 数 组 从 后 向 前 来 存放 各 位 编码 值 ， 并 用 start 来 记录 编码 的 起 始 
位 置 。 我 们 可 以 设置 一 结构 数组 Hufftcode， 用 来 存放 各 字符 的 哈 夫 曼 编码 信息 。 数 组 元 素 


的 结构 如 图 6.45 所 示 。 


6.45 ” 险 夫 曼 编码 的 数组 元 素 结构 


其 中 ， 分 量 bit 为 一 维 数组 ， 用 来 保存 字符 的 哈 夫 曼 编码 ;start 表示 该 编码 在 数组 bit 
中 的 开始 位 置 。 所 以 ， 对 于 第 i 个 字符 ， 它 的 哈 夫 曼 编码 存放 在 HuffCodefil.bit 中 的 从 
HuffCode[i].start 到 mn 的 分 量 上 。 其 具体 的 代码 实现 见 算法 6.20。 

算法 6.20” 哈 夫 曼 编码 py 





为 此 ， 其 相应 的 哈 夫 曼 编码 
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for(j=hf.start+1;j<LEN; j++){ 
code [il .bit[j]=hf.bit[j]; 
code [i] .start=hf.start+17 





6.6.3 ”判定 树 问题 


限定 有 12 个 外 表 完 全 相同 的 球 ， 分 别 用 a 一 1 这 12 个 字母 表示 ， 其 中 有 且 仅 有 一 个 球 
是 不 标准 的 。 不 标准 的 球 的 质量 与 真 球 的 质量 不 同 ， 可 能 轻 ， 可 能 重 。 现 要 求 以 天 平 为 工 
具 ， 用 最 少 的 次 数 挑选 出 不 标准 的 球 ， 并 判断 这 个 球 的 质量 比 其 他 球 是 重 还 是 轻 。 图 6.46 
中 大 写字 母 H 和 工 分 别 表示 不 标准 球 较 其 他 球 重 或 轻 ， 括 号 中 的 字母 表示 已 经 判定 的 标 
准 球 。 下 面 对 这 一 判定 方法 加 以 说 明 ， 并 进行 分 析 ， 如 图 6.46 所 示 。 
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从 12 个 球 中 任 取 8 个 ， 假 设 是 a~h， 在 天 平 两 端 各 放 4 个 进行 比较 。 假 设 a、b、e 
和 d 这 4 个 球 放 在 天 平 的 一 端 ，e、f、g 和 h 放 在 天 平 的 另 一 端 ， 可 能 出 现 的 结果 有 以 下 3 


1 © 
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种 : @Datbtctd>etftgth; @atbtctd=etftgth; @atbtctd<etftgth。 

这 里 仅 以 第 一 种 情况 为 例 进行 分 析 , 由 此 情况 可 以 知道 , 这 8 个 球 中 必 有 一 个 不 标准 ， 
说 明 i、j、k 和 1 为 标准 球 。 这 时 可 以 将 天 平 两 端 各 去 掉 一 个 球 ， 假 设 它们 是 d 和 h， 同 时 
将 天 平 两 端的 球 各 换 一 个 ,假设 球 c 和 e 进行 了 互 换 ， 同 时 将 球 g 换 为 标准 球 1， 然 后 进行 
第 二 次 比较 ， 那 么 比较 的 结果 有 以 下 3 种 : 

(1) atbte<c+f+tl， 这 时 进一步 检测 c 和 a。 若 c=a， 则 因为 b>f， 而 1 是 标准 球 ， 所 以 可 
以 判定 球 e 轻 ， 若 c>a， 则 e 为 重 球 。 

(2) atbte=c+f+tl， 此 时 天 平 两 端 平衡 ， 表 明 不 标准 的 球 在 去 掉 的 球 g、h 和 d 中 ， 进 一 
步 测试 gs 和 h。 若 gs=h， 则 d 为 较 重 的 球 ， 若 g<h， 则 可 以 判定 球 轻 ， 否 则 hh 轻 。 

(3) atb+e>c+ 人 fl， 显然 和 c 为 标准 球 ， 不 标准 的 球 一 定 在 a、b、f 中 ， 这 时 进一步 检 
测 a 和 b。 若 a<b， 则 b 是 较 重 的 球 ， 若 a=b， 则 了 为 较 轻 的 球 ， 若 a>b， 则 a 是 较 重 的 球 。 

同 理 ， 其 他 的 情况 都 可 以 如 上 分 析 。 






































本 章 小 结 
本 章 讨论 了 树 和 二 又 树 两 种 数据 类 型 的 定义 以 及 它们 的 实现 方法 。 树 是 以 分 支 关 系 定 
义 的 层次 结构 ， 结 构 中 的 数据 元 素 之 间 存 在 着 “一 对 多 ”的 关系 ， 因 此 ， 它 为 计算 机 应 用 
中 出 现 的 具有 层次 关系 或 分 支 关系 的 数据 ,提供 了 一 种 自然 的 表示 方法 。 例 如 ， 用 树 描述 
人 类 社会 的 族谱 和 各 种 社会 组 织 机 构 。 在 计算 机 学 科 和 应 用 领域 中 ， 树 也 得 到 广泛 应 用 ， 
例如 ， 在 编译 程序 中 ， 用 树 来 表示 源 程 序 的 语法 结构 等 
二 叉 树 是 和 树 不 同 的 另 二 种 树 形 结构 ， 它 有 明确 的 左 子 树 和 右 子 树 ， 因 此 当 用 二 叉 树 
来 描述 层次 关系 时 ， 其 “ 左 孩 子 ” 表示 “下 属 关系 ”， 而“ 右 孩 子 ”表示 “同一 层次 的 关系 ”。 
由 于 二 叉 树 还 是 以 后 各 章 中 讨论 其 他 问题 时 经 常用 到 的 工具 ， 因 此 二 叉 树 的 儿 个 重要 特性 
是 我 们 应 该 熟练 掌握 的 。 例 如 ,二 又 树 的 第 主 层 至 多 有 2 站 个 结 点 ; 深度 为 h 的 二 又 树 至 多 
有 2"-1 个 结 点 作对 任何 一 棵 二 又 树 T， 如 果 其 终端 结 点 数 ( 即 叶子 结 点 数 ) 为 nn， 度 为 2 的 
结 点 数 为 m， 则 no= nz+1。 
树 和 二 又 树 的 遍历 算法 是 实现 各 种 操作 的 基础 。 对 非 线 性 结构 的 遍历 需要 选择 合适 的 搜 
索 路 径 ， 以 确保 在 这 条 路 径 上 可 以 访问 到 结构 中 的 所 有 数据 元 素 ， 并 使 每 一 个 数据 元 素 只 被 
访问 一 次 。 由 于 树 和 二 又 树 是 层次 分 明 的 结构 ， 因 此 按 层次 进行 遍历 是 自然 的 事 ， 它 必 能 实 
现 既 访问 到 所 有 元 素 ， 又 不 会 重复 访问 。 此 外 ， 对 树 和 二 义 树 还 可 进行 先 左 后 右 的 遍历 。 
遍历 的 实质 是 按 某 种 规则 将 二 又 树 中 的 数据 元 素 排列 成 一 个 线性 序列 ， 二 又 树 的 线索 
链表 便 可 看 成 二 又 树 的 一 种 线性 存储 结构 ， 在 线索 链表 上 可 对 二 又 树 进行 线性 化 的 遍历 ， 
即 不 需要 递归 ， 而 是 从 第 一 个 元 素 起 ， 逐 个 访问 后 继 元 素 直 至 后 继 为 空 止 。 因 此 线索 链表 
是 通过 遍历 生成 的 ， 即 在 遍历 过 程 中 保存 结 点 之 间 的 前 趋 和 后 继 的 关系 ， 并 为 方便 起 见 ， 
在 线索 链表 中 添加 一 个 头 结 点 ， 并 由 此 构成 一 个 双向 循环 链表 。 在 实际 应 用 时 也 可 简化 为 
单 向 循环 链表 ( 即 只 保存 后 继 或 前 趋 关 系 )。 
在 本 章 的 应 用 部 分 ， 介 绍 了 最 优 二 又 树 ( 哈 夫 曼 树 ) 和 最 优 前 绥 编 码 ( 哈 夫 曼 编码 ) 的 构造 方 
法 ， 最 优 二 又 树 是 一 种 “ 带 权 路 径 长 度 最 短 ” 的 树 ， 最 优 前 级 编码 是 最 优 二 又 树 的 一 种 应 用 。 
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CC 3 
习题 与 思考 
6.1 单 选 题 
1. 设 树 T 的 度 为 4， 其 中 度 为 1、2、3 和 4 的 结 点 个 数 分 别 为 4、2、1、1， 则 了 中 
的 叶子 数 为 (  )。 
A. 6 B. 5 C. 9 D. 8 
2. 一 棵 具有 1025 个 结 点 的 二 叉 树 的 高 度 为 ( )。 
A. 12 和 1025 之 问 B. 11 C. 11 和 1025 之 间 万 : 沁 
3， 若 高 度 为 于 的 二 叉 树 F 只 有 度 为 0 和 度 为 2 的 结 点 ， 则 下 中 所 包含 的 结 点 数 至 少 
为 (  )。 y 
A. 2H-1 B. 2H+1 C. 2H DD, Hl 


4. 已 知 某 二 又 树 的 后 序 遍 历 序列 是 dabece， 中 序 遍 历 序列 是 debac， 它 的 前 序 遍 历 是 
(  )。 KV 
A. acbed B. decab CGC deatc 后 D. cedba 
5 前 序 遍 历 和 中 序 遍 历 结 果 相 同 的 二 又 树 定 (一 )。 

A， 所 有 结 点 只 有 右 子 树 的 二 叉 树 -|< B.- 所 有 结 点 只 有 左 子 树 的 二 又 树 

C. 根 结 点 无 左 孩子 的 二 叉 树 ~ “D. 根 结 点 无 右 孩子 的 二 叉 树 
6.2 ”填空 题 NeNN J 
1. 某 二 叉 树 的 前 序 序列 和 后 序 序列 正好 相反 ， 则 该 三 义 树 一 定 是 的 三 叉 树 。 
2. 已 知 一 算术 表达 式 的 中 缀 形式 为 AHB+C-DIEY 后 级 形式 为 ABC*+DE/-， 其 前 绷 形 


式 为 es 





3 引入 二 又 线 壶 材 的 目的 是 
4，20 个 结 点 的 线索 二 又 树 上 含有 的 线索 数 为 
5. 由 权 值 为 (3, 8, 6, 2, 5) 的 叶子 结 点 生成 一 棵 哈 夫 曼 树 , 其 带 权 路 径 长 度 为 8 
6.3 ”思考 题 

1, 根据 图 6.47 所 示 的 一 棵 树 回 答 下 面 问题 : 

人) 
(8) © 
©) (ED (9 


) WV OW 


6.47 树 



































(1) 哪个 是 根 结 点 ? 

(2) 哪些 是 叶子 结 点 ? 

(3) 哪个 是 EE 的 父 结 点 ? 

(4) 哪些 是 EE 的 子孙 结 点 ? 

(5) 哪些 是 E 的 兄弟 结 点 ? 哪些 是 C 的 兄弟 结 点 ? 





(6) 结 点 B 和 结 点 工 的 层 数 分 别 是 多 少 ? 

(7) 树 的 深度 是 多 少 ? 

(8) 以 结 点 G 为 根 的 子 树 的 深度 是 多 少 ? 

(9) 树 的 度 是 多 少 ? 

2. 分 别 画 出 含 3 个 结 点 的 树 与 二 叉 树 的 所 有 不 同形 态 。 

3. 高 度 为 h 的 完全 二 叉 树 至 少 有 多 少 个 结 点 ? 最 多 有 多 少 个 结 点 ? 
4. 采用 顺序 存储 方法 和 链 式 存储 方法 分 别 画 出 图 6.48 所 示 的 二 又 树 的 存储 结构 。 
































图 6.48 二 又 树 ON 


5。 分 别 写 出 图 6.48 所 示 二 叉 树 的 前 序 、 中 序 和 后 序 遍 历 序列 。 

6. 车 二 叉 树 中 各 结 点 值 均 不 相同 ， 根 据 如 下 茶 件 画 出 此 二 叉 树 ; 

(1) 已 知 一 个 三 又 树 的 中 序 遍 历 和 后 序 遍 房 序列 分 别 为 GDHBAECIF 和 GHDBEIFCA， 
试 画 出 此 二 又 树 。 KY 

(2) 已 知 一 个 二 叉 树 的 前 序 遍 历 和 中 序 遍 历 序列 分 别 为 ABCDEFGH 和 BDCEAFHG， 
试 画 出 此 二 叉 树 。 :0 六 

7， 输入 一 个 正 整 数 序 列 {55,34,18,88,119,11,76,9,97;99,46} ， 试 构造 一 个 二 叉 排序 树 。 

8， 有 一 份 电文 中 共 使 用 5 个 字符 :a、b、ev dve， 它 们 出 现 的 频率 依次 为 5、2、 
6、4。 试 画 出 对 应 的 哈 夫 曼 树 ， 并 求 出 每 个 字符 的 哈 夫 曼 编码 。 

9 输入 关键 字 序列 {53，25，76，20,， 48; 14，60，84}， 建 立 一 棵 二 又 排序 树 ， 并 指 
出 该 二 又 树 是 否 为 平衡 二 又 树 。 

10. 假设 二 又 排序 树 t 的 各 元 素 值 均 不 相同 ， 设 计 一 个 算法 按 递 增 次 序 输出 各 元 素 值 。 

11. 试 设计 一 个 算法 ， 要 求 该 算法 把 二 叉 树 的 叶子 结 点 按 从 左 到 右 的 顺序 连 成 一 个 单 
链表 ， 表 头 指针 为 head。 二 又 树 按 二 又 链表 方式 存储 ， 链 接 时 用 叶子 结 点 的 右 指针 域 来 存 
放 单 链表 指针 。 

12. 二 又 树 采用 二 又 链表 存储 ， 编 写 计 算 整 个 二 又 树 高 度 的 算法 (二 又 树 的 高 度 也 称 为 
二 又 树 的 深度 )。 

13， 试 写 一 个 算法 ， 在 后 序 线索 二 又 树 中 查找 给 定 结 点 部 在 后 序 序列 中 的 后 继 ( 二 又 
树 的 根 结 点 指针 并 未 给 出 )， 并 讨论 实现 算法 对 存储 结构 有 何 要 求 。 

14. 试 编写 算法 ， 求 给 出 二 叉 树 上 从 根 结 点 到 叶子 结 点 的 一 条 路 径 长 度 等 于 树 的 深度 
减 一 的 路 径 ( 即 列 出 从 根 结 点 到 该 叶子 结 点 的 结 点 序列 )， 若 这 样 的 路 径 存在 多 条 ， 则 输出 
路 径 终点 (叶子 结 点 ) 在 “最 左 ” 的 一 条 。 
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(1) 领会 图 的 类 型 定义 。 
(2) 熟悉 图 的 各 种 存储 结构 及 其 构造 算法 。 SN 
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公 
(3) 熟练 学 握 图 的 两 种 遍历 及 最 小 生成 树 、 最 短 | 排序 算法 。 


应 用 问 法 。 
(4) 理解 各 种 图 的 应 用 问题 算法 XX} 


i 





图 的 应 用 极为 广泛 ， 而 且 图 的 各 种 应 用 问题 的 算法 都 比较 经 典 ， 因 此 本 章 重点 在 于 理 
解 各 种 图 的 算法 及 其 应 用 场合 。 


离散 数学 中 的 图 论 是 专门 研究 图 性 质 的 一 个 数学 分 支 ， 但 图 论 注重 研究 图 的 纯 数学 性 质 ， 
而 数据 结构 中 对 图 的 讨论 则 侧重 于 在 计算 机 中 如 何 表示 图 ， 以 及 如 何 实现 图 的 操作 和 应 用 等 。 
图 是 比 线性 表 和 树 更 为 复杂 的 数据 结构 ， 因 此 和 线性 表 、 树 不 同 ， 虽 然 在 遍历 图 的 同时 可 以 对 
顶点 或 弧 进行 各 种 操作 , 但 更 多 图 的 应 用 问题 (如 求 最 小 生成 树 和 最 短路 径 等 ) 在 图 论 的 研究 中 都 
早已 有 了 特定 算法 ， 在 本 章 中 主要 介绍 它们 在 计算 机 中 的 具体 实现 。 这 些 算法 乍 一 看 都 比较 难 ， 
应 多 对 照 具 体 图 例 的 存储 结构 进行 学 习 。 图 遍历 的 两 种 搜索 路 径 和 树 遍历 的 两 种 搜索 路 径 极为 
相似 ， 应 将 两 者 的 算法 对 照 学 习 以 便 提高 学 习 的 效益 。 


7.1 图 的 基本 概念 





图 是 一 种 比 线性 表 和 树 更 为 复杂 的 数据 结构 。 为 了 与 树 形 结构 加 以 区 别 ， 在 图 结构 中 
常常 将 结 点 称 为 顶点 ， 边 是 顶点 的 有 序 偶 对 。 若 两 个 顶点 之 间 存 在 一 条 边 ， 就 表示 这 两 个 
顶点 具有 相 邻 关系 。 

其 由 V(G) 和 E(G) 这 两 个 集合 组 成 , 记 为 .G=(V,E); 其 中 V(G) 是 顶点 (vertex) 的 
E(G) 是 边 (edge) 的 集合 , 特殊 情况 下 E(G) 可 以 是 空 集 。 每 个 边 由 其 所 连接 的 两 个 顶点 表示 。 

在 图 7.1 所 示 的 图 结构 中 ， 一 个 是 有 向 图 ， 即 每 条 边 都 有 方向 ， 另 一 个 是 无 向 图 ， 即 
每 条 边 都 没有 方向 。 














(9 无 向 图 G1 (b) 有 向 图 G2 (c) 于 向 图 G3 
7.1 有 向 图 和 无 向 图 


在 一 个 图 G 中 ， 如 果 任 意 两 个 顶点 之 间 的 连 线 (vi, vi) ( 称 为 边 ) 是 没有 方向 的 ， 则 称 该 
图 为 无 向 图 ,如 图 7.1(a) 所 示 ,V(GD={fvuvzvavevs》 而 ECG1)={(visv2),(Visv3), (Visv4), (Vasv4), 
(VasVs),(Vasvs), (vav5}， 因 为 G1 的 边 没有 方向 ， 故 (vi,v2) 也 可 以 写成 (vyv1)，(v2svs) 也 可 以 写 
成 (viavz)， 等 等 。 

在 一 个 图 G 中 ， 如 果 任 意 两 个 项 点 之 间 的 连 线 <vi vi> ( 称 为 弧 ) 是 有 方向 的 ， 则 称 该 图 
为 有 向 图 .如 图 7.1(b) 所 示 ,V(G2)={fviuvzvayv4} ,而 E(G2)={<vivz>, <V2yV3>, <va,v4>, <V3,V4>， 
<Vv4,V3>, <V4VI>} 。 

边 集中 的 尖 括 号 表示 有 向 边 ， 因 而 <v3,vs> 和 <vayv3> 表 示 两 条 不 同方 向 的 边 。 以 <v3,v4> 
为 例 ，v3 顶点 称 为 此 边 的 起 点 或 尾 ，v4 顶点 称 为 此 边 的 终点 或 头 。 边 的 方向 规定 为 从 起 点 
到 终点 ， 并 用 箭头 表示 出 来 。 

在 一 个 无 向 图 中 , 如 果 任 意 两 顶点 都 有 一 条 直接 边 相连 接 ， 则 称 该 图 为 无 向 完全 图 


(图 7.2)。 一 个 含有 n 个 顶点 的 无 向 完全 图 中 有 n(n-1)/2 条 边 。 







































































7.2 完全 图 G4 
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ee 的 
() 有 向 图 中 ， 如 果 任 意 两 项 点 之 间 都 有 方向 互 为 相反 的 两 条 弧 
相连 接 ， 则 称 该 图 为 有 向 完全 图 。 在 一 个 含有 n 个 顶点 的 有 向 完 
G) 全 图 中 有 n(n-1) 条 边 。 
wb 若 一 个 图 接近 完全 图 ， 称 为 稠密 图 (dense graph); 称 边 数 很 少 
G) (人 的 图 为 稀疏 图 (spares graph)。 








顶点 的 度 、 入 度 、 出 度 含义 如 下 。 
(1) 顶点 的 度 (degree) 是 指 依附 于 某 顶点 v 的 边 数 ， 通 常 记 为 








TD (v)。 在 有 向 图 中 要 区 别 顶 点 的 入 度 与 出 度 的 概念 。 
(2) 顶点 v 的 入 度 是 指 以 顶点 Vv 为 终点 ( 弧 带 箭头 的 一 端 ) 的 弧 的 数目 ， 记 为 ID(V)。 
(3) 顶点 v 的 出 度 是 指 以 顶点 v 为 始点 的 弧 的 数目 ， 记 为 OD (v)。 
(4) 有 向 图 中 某 顶点 的 度 为 TD (vi)=ID (vi) 十 OD (vi)。 
在 图 7.1 所 示 的 G1 图 中 ， 顶 点 vi 的 度数 为 3， 顶 点 v3 的 太 2…… 对 于 G2， 顶 点 


























wi 的 入 度 为 1， 出 度 为 1， 所 以 该 顶点 的 度数 为 2。 LA 

与 边 有 关 的 数据 信息 称 为 权 (weighb。 在 实际 应 用 中 ， 权 信 冲 以 有 某 种 含义 。 边 上 带 权 
的 图 称 为 网 或 网 络 (network) 。 

顶点 vp 到 顶点 va 之 同 的 路 径 Coatm) 是 指 顶 应 庆 区 wwuva vimvq。 其 中 ，(vpyvi， 





Cvibvz)，…，(vimvq) 分 别 为 图 中 的 边 。 路 径 止 边 的 数目 称 为 路 径 长 度 。 
回路 、 简 单 路 径 、 简 单 回 路 含义 如 下 。 
(1) 序列 中 顶点 不 重复 出 现 的 路 径 称 为 简单 路 径 。 
(2) 路 径 中 第 一 个 顶点 与 景 后 一 个 项 点 相同 的 路 径 称 为 回路 或 者 环 (cycle)。 


(3) 除 第 一 个 顶点 与 最 后 一 个 顶点 之 外 ， 其 他 顶点 不 重复 出 现 的 回路 称 为 简单 回路 ， 
或 者 简单 环 。 和 



































如 图 7.1 所 示 #<GL 中 的 (vi,v2,va) 就 是 简单 路 径 ， 而 (vi,v2,vavi) 就 不 是 简单 路 径 。 


对 于 图 








的 一 个 子 图 。 








G3(V, E)，G'=(V', E)， 若 存在 V' 是 V 的 子 集 ，E' 是 EE 的 子 集 ， 则 称 图 G 是 G 
图 7.3 所 示 为 图 7.1 中 G1 的 一 些 子 图 。 


在 无 向 图 中 ， 如 果 从 一 个 顶点 vi 到 另 一 个 顶点 Vi( 罚 ) 有 路 径 ， 则 称 顶 点 vi 和 vi 是 连 
通 的 。 如 果 图 中 任意 两 顶点 都 是 连通 的 ， 则 称 该 图 是 连通 图 。 无 向 图 的 极 大 连通 子 图 称 为 
连通 分 量 。 详 见 图 7.4 所 示 的 无 向 图 及 其 3 个 连通 分 量 。 





7.3 子 图 





在 图 7.1(a) 所 示 的 无 向 图 G1 中 ， 顶 点 vi 到 顶点 vs 是 有 路 径 的 ， 所 以 是 连通 的 。 因 为 











无 向 图 G1 中 ， 


对 于 有 


@, 











任意 两 点 均 连 通 ， 所 以 G1 是 一 个 连通 图 。 
向 图 来 说 , 车 从 顶点 vi 到 顶点 vi 到 顶点 vi 之 间 都 有 路 径 , 则 称 这 两 点 是 强 连通 





G ER 


的 。 若 对 于 图 中 任意 一 对 顶点 vi 和 Vi( 入 )， 均 有 从 一 个 顶点 vi 到 另 一 个 顶点 vi 的 路 径 ， 
也 有 从 vi 到 vi 的 路 径 , 则 称 该 有 向 图 是 强 连通 图 。 有 向 图 的 极 大 强 连通 子 图 称 为 强 连 通 
分 量 。 




















7.4 无 向 图 及 其 3 个 连通 分 量 


在 图 7.1(b) 所 示 的 有 向 图 GZ 中 ,顶点 w 和 顶点 v3 是 强 连通 的 。 如 图 7.5(a) 所 示 ， 此 
图 不 是 强 连通 图 ， 因 为 v 到 其 他 顶点 不 存在 路 径 。 图 .7.5(a) 所 示 有 向 图 G5 的 两 个 强 连 通 
分 量 如 图 7.5(b) 所 示 。 


Se 


(a) 有 向 图 G5 (b) G5 的 岗 个 强 连 通 分 量 
图 7.5 有 向 图 及 其 连通 分 量 


连通 图 G 的 生成 树 ， 是 G 的 包含 其 全 部 n 个 顶点 的 一 个 极 小 连通 子 图 。 在 生成 树 中 
添加 任意 一 条 属于 原 图 中 的 边 必定 会 产生 回路 ， 若 生成 树 中 减少 任意 一 条 边 ， 则 必然 成 为 
非 连 道 的 。 

在 非 连通 图 中 ， 由 每 个 连通 分 量 都 可 得 到 一 个 极 小 连通 子 图 ， 即 一 棵 生成 树 。 这 些 连 
通 分 量 的 生成 树 就 组 成 了 一 个 非 连通 图 的 生成 森林 。 从 另外 一 个 角度 来 说 ， 如 果 一 个 有 向 
图 恰 有 一 个 顶点 的 入 度 为 0， 其 余 顶 点 的 入 度 均 为 1， 则 是 一 棵 有 向 树 。 一 棵 有 向 树 的 生成 
森林 由 若干 棵 有 向 树 组 成 ， 含 有 图 中 全 部 顶点 ， 但 只 有 足以 构成 若干 棵 不 相交 的 有 向 树 的 
弧 ， 图 7.6 所 示 为 其 一 例 。 

在 带 权 图 (网 或 者 网 络 ) 中 ， 对 应 每 条 边 有 一 个 相应 的 数值 ， 这 个 数值 称 为 该 边 的 权 ; 
而 带 权 的 图 称 为 网 。 网 可 分 为 有 向 网 和 无 向 网 。 不 同 网 络 的 权 有 不 同 的 意义 : 电网 络 权 可 
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以 是 阻抗 ， 运 输 网 络 中 的 权 可 以 是 路 程 长 度 、 运 费 等 ， 如 图 7.7(@) 所 示 ， 每 条 边 上 的 数字 
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(a) 有 向 图 G6 (b) 相应 生成 森林 
图 7.6 有 向 图 G6 及 其 生成 森林 
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二 loriio 
(a) 网 络 ( 带 权 雹 向 图 ) 过 (b) 无 向 图 G1 的 邻接 算 陈 


7.7， 网 络 及 无 向 图 G1 的 邻接 矩阵 


7.2 图 的 存储 方式 


为 了 便于 计算 机 处 理 图 的 问题 ， 需 要 把 图 的 各 项 点 间 的 连接 关系 输入 计算 机 。 只 有 采 
计算 机 容易 接收 和 处 理 的 数据 结构 来 表示 图 ， 才 能 有 利于 计算 机 进行 运算 。 
对 于 具体 的 图 而 言 ， 最 好 的 存储 结构 不 仅 依赖 数据 的 性 质 ， 而 且 依 赖 在 这 些 数 据 上 所 实 
施 的 操作 。 恰 当地 选择 存储 结构 也 受到 其 他 一 些 因素 的 影响 ， 如 顶点 的 数目 、 度 的 平均 数 、 有 
向 图 还 是 无 向 图 等 。 如 果 顶 点 的 度数 相差 很 大 ， 按 度数 最 大 的 顶点 设计 结 点 结构 , 会 造成 很 多 
存储 单元 的 浪费 ; 而 若 按 每 个 顶点 自己 的 度数 设计 不 同 的 顶点 结构 ， 又 带 来 操作 的 不 便 。 因 此 
对 于 图 来 说 ， 如 何 对 它 实现 物理 存储 是 一 个 难题 ， 本 节 介绍 以 下 3 种 不 同 的 存储 结构 。 


7.2.1 ”邻接 和 矩 阵 


邻接 矩阵 是 表示 顶点 之 间 相 邻 关系 的 矩阵 。 用 二 维 数组 A[n][n] 的 矩阵 存储 图 中 顶点 信 
息 表示 各 顶点 间 的 相 邻 关系 。 和 矩阵 元 素 A[i[j] 的 值 表示 项 点 vi( 行 ) 与 顶点 vi( 列 ) 间 的 关系 。 
对 于 有 向 图 的 邻接 算 阵 来 说 ， 当 <vi,v 产 是 该 有 向 图 中 的 一 条 弧 时 ，A[ij]=1， 否 则 
A[ij]=0。 第 i 个 顶点 vi 的 出 度 为 矩阵 中 第 i 行 中 “1” 的 个 数 ， 入 度 为 第 i 列 中 “1” 的 个 
数 。 有 向 图 弧 的 条 数 等 于 矩阵 中 “1” 的 个 数 。 

对 于 无 向 图 的 邻接 矩阵 来 说 ， 当 (vi, vj) 是 该 无 向 图 中 的 一 条 边 时 , A[i,j]=Ali,ij=1, 否 
则 A[ij]=A[j,i]=0。 第 i 个 顶点 的 度 为 矩阵 中 第 i 行 中 “1” 的 个 数 或 第 i 列 中 “1” 的 个 数 。 
图 中 边 的 数目 等 于 矩阵 中 “1” 的 个 数 的 一 半 ， 这 是 因为 每 条 边 在 矩阵 中 描述 了 两 次 。 
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即 
AELi= 下 当 项 点 vi 到 项 点 v 间 有 连 线 时 
小 “|o 其 他 
而 对 于 有 权 值 的 网 络 图 来 说 ， 有 
Ai 和 
,J wo， 其 他 
例如 ， 图 7.1(a) 所 示 无 向 图 G1 的 邻接 矩阵 如 图 7.7(b) 所 示 ， 图 7.8(a) 所 示 有 向 图 的 邻 
接 和 矩阵 如 图 7.8(b) 所 示 。 
对 于 无 向 图 来 说 ， 其 邻接 矩阵 是 对 称 的 ， 即 aiFaii。 图 7.7(a) 的 邻接 矩阵 如 图 7.8(c) 所 示 。 
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(a) 有 向 图 (b) A 短 阵 。“(e) 光 向 图 的 邻接 年 陈 
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Re x 黎 

nts 和 定 的 ， 

C) 无 向 图 和 无 向 网 的 邻接 矩阵 是 一 个 对 

G) 无 向 图 邻接 逢 阵 中 第 1 行 (或 第 齐 ) 的 非 0 元素 的 个 数 即 为 第 1 个 顶点 的 度 。 

(4) 有 向 图 邻接 短 阵 第 i 行 非 0 元 素 个 数 为 第 i 个 顶点 的 出 度 ， 第 1 列 非 0 元素 个 数 为 
第 i 个 项 点 的 入 度 ， 第 i 个 项 点 的 度 为 第 i 行 与 第 i 列 非 0 元 素 个 数 之 和 。 

(5) 无 向 图 的 边 数 等 于 邻接 矩阵 中 非 0 元 素 个 数 之 和 的 一 半 ， 有 向 图 的 弧 数 等 于 邻接 
矩阵 中 非 0 元 素 个 数 之 和 。 
需要 说 明 的 是 邻接 敌阵 表示 法 对 于 以 图 的 顶点 为 主 的 运算 比较 适用 。 此 外 ， 除 完全 图 
外 ， 其 他 图 的 邻接 算 阵 有 许多 零 元 素 ， 特 别 是 当 n 值 较 大 ， 而 边 数 相对 完全 图 的 边 (n- 
又 少 得 多 时 ， 则 此 矩阵 称 为 “ 稀 琉 算 阵 ”， 浪 费 存储 空间 。 

在 C 语言 中 ， 实 现 邻接 敌阵 表示 法 的 类 型 定义 见 算法 7.1。 

算法 7.1 无 向 网 图 的 邻接 矩阵 表示 

typedef struct 

{ 
































VertexType vexs [MAXVEX]; // 顶 点 对 齐 

int arc[MAXVEX] [MAXVEX]; // 邻 接 矩 阵 ， 可 看 作 边 表 

int numVertexes, numEdges; // 图 中 当前 的 顶点 数 和 边 数 
}MGraph; 


void CreateMGraph(MGraph *G) 


只 
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一 一 ~ 一 


int 寺 才 WwW 
printf(" 输 入 顶点 数 和 边 数 :\n"); 
scanf("%d, %d", &G->numNodes, &G->numEdges); 
for(i = 0;i <G->numNodes;i++) // 读 入 顶点 信息 ， 建 立项 点 表 
scanf(&G->Vexs[i])7 
for(i = 0;i <G->numNodes;i++) 
for(j = 0;j <G->numNodes;j++) 
G->arc[i] [j]=INFINITY; 
for(k = 0;k <G->numEdges;k++) // 读 入 numEdges 条 边 ， 建 立 邻接 矩阵 





printf(" 输 入 边 (vi, vj) 上 的 下 标 i， 下 标 j 了 和 权 w:\n"); 
scanf("%d, $d, %d", gi, &j, Ew); 


G->arc[i] [j]=w; 
G->arc[j] [i]= G->arc[i] [j]; 论 
sa 


7.2.2 ”邻接 表 


邻接 表 是 图 的 一 种 链接 存储 结构 。 在 邻 和 用 一 个 顺序 存储 区 来 存储 图 中 
各 顶点 的 数据 ， Th et 邻接 表 )， 把 项 点 
的 所 有 相 邻 项 点 ， 即 其 后 继 项 点 的 

邻接 表 中 的 每 一 个 结 oo 邻接 点 域 和 指针 域 。 其 中 ， 邻 接点 
ta i pe 而 指针 域 用 于 指向 下 一 个 边 表 结 点 。 每 个 
nd 据 外 忆 还 设置 了 mt 个 顶点 

维 数 组 表示 ， 如 图 79 所 示 。 








久 接 上 填 人 | 指针 域 > mi 边 表 头 指针 
Ce Te] 
“(a) 边 表 结 构 (b) 顶点 表 结构 


图 7.9 邻接 矩阵 表示 的 结 点 结构 


在 无 向 图 的 邻接 表 中 ， 顶 点 vi 的 每 一 个 边 表 结 点 对 应 于 与 vi 相关 联 的 一 条 边 ; 而 在 有 
向 图 的 邻接 表 中 ，vi 的 每 一 个 边 表 结 点 对 应 于 以 vi 为 始点 的 一 条 弧 ， 因 此 ， 也 称 有 向 图 的 
邻接 表 的 边 表 为 出 边 表 。 这 样 ， 在 有 向 图 的 邻接 表 中 求 第 i 个 顶点 的 出 度 很 方便 ， 即 为 第 i 
个 出 边 表 中 结 点 的 个 数 ， 但 是 如 果 要 求 得 到 第 i 个 顶点 的 入 度 则 必须 遍历 整个 表 。 考 虑 在 有 
向 图 的 邻接 表 中 , 将 顶点 vi 的 每 个 边 表 结 点 对 应 于 以 Vi 为 终点 的 一 条 弧 , 即 用 边 表 结 点 的 邻 
接点 域 存储 邻接 到 vi 的 顶点 的 序号 ， 由 此 构成 的 邻接 表 称 为 有 向 图 的 逆 邻 接 表 ， 逆 邻接 表 有 
边 表 称 为 入 边 表 。 这 样 在 道 邻接 表 中 求 某 项 点 的 入 度 与 在 邻接 表 中 求 项 点 的 出 度 一 样 方便 。 

对 于 网 络 ， 则 只 需要 在 以 上 边 表 结 点 的 结构 中 增设 一 个 权 值 域 。 

邻接 表 与 邻接 矩阵 的 关系 可 以 表述 如 下 

(1) 对 应 于 邻接 矩阵 的 每 一 行 有 一 个 线形 链接 表 。 

(2) 链接 表 的 表 头 对 应 着 邻接 矩阵 该 行 的 顶点 。 

(3) 链接 表 中 的 每 个 结 点 对 应 着 邻接 矩阵 中 该 行 的 一 个 非 零 元 素 。 


@r 




































































(4) 对 于 无 向 图 ， 一 个 非 零 元 素 表 示 与 该 行 项 点 相 邻 接 的 另 一 个 顶点 
(5) 对 于 有 向 图 ， 非 零 元 素 则 表示 以 该 行 顶 点 为 起 点 的 一 条 边 的 终 

















到 7.5(a) 所 示 的 有 向 图 G5 的 邻接 表 如 图 7.10(a) 所 示 ， 北 邻接 表 如 图 7.10(b) 所 示 。 而 
图 7.1(c) 所 示 的 无 G3 的 邻接 表 如 图 7.10(c) 所 示 。 
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(6) 无 向 图 G3 的 邻接 表 
图 未 10 ”图 的 邻接 表 和 着 邻接 表 


通过 图 7.10 我 们 发 现 , 在 无 向 图 的 邻接 表 中 , 顶点 vi 的 度 恰 为 第 i 个 链表 中 的 结 点 数 ， 






而 在 有 向 图 中 ， 第 二 个 链表 中 的 结 点 个 数 只 是 顶点 立 的 出 度 ， 为 求 入 度 ， 必 须 遍 有 历 整个 邻 
接 表 。 在 所 有 链表 中 其 邻接 点 域 的 值 为 i 的 结 点 的 个 数 是 顶点 vi 的 入 度 。 
在 C 语言 中 , ) 实 现 邻 接 表 存储 结构 的 类 型 定义 如 下 : 





#define MAXVEX 50 // 最 大 顶点 数 ， 应 由 用 户 定义 
typedef char VertexType; // 顶 点 类 型 应 由 用 户 定义 
typedef int EdgeType; // 边 上 的 权 值 类 型 应 由 用 户 定 义 
typedef struct EdgeNode // 边 表 结 点 
{ 
int adjvex; // 邻 接点 域 ， 存 储 该 顶点 对 应 的 下 标 
EdgeType info; // 用 于 存储 权 值 ， 对 于 非 网 图 可 以 不 需要 
struct EdgeNode *next; // 链 域 ， 指 向 下 一 个 邻接 点 
}EdgeNode; 
typedef struct VertexNode // 顶 点 表 结 点 
VertexType data; // 顶 点 域 ， 存 储 顶 点 信息 
EdgeNode *firstedge; // 边 表 头 指针 


}VertexNode, AdjList [MAXVEX]; 
typedef struct 
{ 


只 
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建立 无 向 图 的 邻接 表 结构 的 代码 见 算法 7.2。 
算法 7.2 邻接 表 的 存储 






这 里 的 虚线 部 分 看 起 来 有 些 相似 , 是 由 于 对 于 无 向 图 来 说 , 一 条 边 都 是 对 应 两 个 顶点 ， 
所 以 在 循环 中 ， 一 次 就 针对 i 和 j 分 别 进行 了 插入 ， 对 于 有 向 图 米 说 ， 只 需要 两 个 虚线 部 
分 的 一 个 就 可 以 了 。 
7.2.3 ”关联 矩阵 


图 的 男 一 种 算 阵 表示 法 为 以 顶点 和 边 的 关联 关系 为 基础 建立 算 阵 ， 这 个 第 阵 称 为 关联 
拢 阵 。 在 关联 矩阵 中 ， 每 行 对 应 于 图 的 一 个 结 点 ， 每 列 对 应 于 图 的 一 条 弧 。 
对 于 无 向 图 G = (V,B) 来 说 ， 其 关联 矩阵 是 一 个 |v|x|B| 矩 阵 ， 使 得 


1， 当 顶 点 Vi 与 边 e 关 联 时 


soa= 攻 其 他 


@y 


A[ij] 表示 在 关联 算 阵 中 顶点 V 和 边 ej 之 间 的 关系 。 若 顶点 V 和 边 ej 之 间 是 连 着 的 ， 
则 A[ij] =1; 反之 ， 则 A[ij] =0。 
同 理 ， 对 于 有 向 图 G' 来 说 ， 其 关联 和 矩阵 可 以 表示 为 
1， 车 结 点 vi 是 e 的 起 点 
-1， 若 结 点 vi 是 e 的 终点 
0， ”车 结 点 vi 与 ej 不 关联 


如 图 7.11 所 示 ， 无 向 图 G 的 关联 窍 阵 如 图 7.11(b) 所 示 ， 而 有 向 图 G' 的 关联 窍 阵 如 图 
7.11(d) 所 示 。 通 过 上 面 的 表述 ， 我 们 可 以 得 到 无 向 图 关联 矩阵 的 性 质 : 
(1) 图 中 每 一 条 边关 联 两 个 结 点 ， 故 关联 矩阵 的 每 一 列 只 有 两 个 1。 
(2) 每 一 行 元 素 的 和 数 对 应 于 结 点 的 度数 。 
(3) 一 行 中 的 元 素 全 为 0， 其 对 应 的 结 点 为 孤立 点 。 了 丛 
(4) 两 个 平行 边 对 应 的 两 列 相同 。 NA 
(5) 同一 图 当 结 点 或 边 的 编 序 不 同 ， 其 对 应 的 关联 A 、 列 序 的 差别 。 
同 理 ， 我 们 可 以 得 到 有 向 图 的 相应 性 质 ， 要 
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(0) 有 向 图 G- (d) G' 对 应 的 关联 甜 阵 


图 7.11 图 的 关联 矩阵 表示 
于 无 论 图 含有 多 少 个 结 点 ， 其 每 列 元 素 只 有 两 个 非 零 元 素 ， 当 图 的 结 点 数 非常 多 的 
时 候 ， 浪 费 的 存储 空间 仍 是 非常 巨大 的 。 
若 无 向 图 中 有 nm 个 顶点 、e 条 边 ， 则 它 的 邻接 表 需 n 个 头 结 点 和 2e 个 表 结 点 。 显 然 ， 
在 边 稀疏 (e<<n(n-1)/2) 的 情况 下 ， 用 邻接 表 表 示 图 比 用 邻接 矩阵 要 节省 存储 空间 ， 当 和 边 
相关 的 信息 较 多 时 更 是 如 此 。 我 们 知道 ， 在 邻接 表 上 容易 找到 任 一 顶点 的 第 一 个 邻接 点 和 
下 一 个 邻接 点 , 但 要 判定 任意 两 个 顶点 (vi 和 vw) 之 间 是 否 有 边 或 弧 相 连 ， 则 需要 搜索 第 i 个 


或 第 j 个 链表 ， 不 如 邻接 矩阵 方便 。 
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7.3 图 的 遍历 








从 图 中 某 个 顶点 出 发 访问 图 中 所 有 顶点 ， 且 使 得 每 一 顶点 仪 被 访问 一 次 ， 这 一 过 程 称 
为 图 的 遍历 。 图 的 遍历 是 图 的 运算 中 最 重要 的 运算 ， 图 的 许多 运算 均 以 遍历 为 基础 。 
回 姑 营 回 图 的 遍历 按 搜索 路 径 不 同 分 为 深度 优先 搜索 (depth first search) 遍 历 和 广度 
让 is 优先 搜索 (breadth first search) 遍 历 。 
对 每 种 搜索 顺序 ， 访 问 各 顶点 的 先后 次 序 也 不 是 唯一 的 。 为 了 避免 同一 顶 
【参考 图 文 】 点 被 多 次 访问 ， 在 图 的 遍历 过 程 中 必须 记 住 每 个 被 访问 过 的 项 点， 一 般 可 设 一 
数组 ， 如 以 visited 为 标志 ， 以 标志 顶点 是 否 被 访问 过 。 若 访问 过 某 顶 点 ， 则 相应 的 数组 元 
素 为 真 ， 否 则 为 假 。 
7.3.1 深度 优先 搜索 遍历 


假定 给 定 图 G 的 初 态 是 所 有 项 点 均 未 曾 访问 过 ,在 'G 中 在 选 一 个 顶点 v 为 初始 出 发 点 ， 
则 深度 优先 搜索 可 定义 如 下 : | 
从 指定 的 起 点 v 出 发 ( 先 访问 v， het Bledel si nt a 
wi， 再 访问 wi 的 任 一 未 访问 的 村 W 某 顶 点 已 无 被 访问 过 的 邻 
接 顶 点 或 者 它 的 所 有 邻接 。 如 果 这 个 访问 和 回溯 过 
程 返回 遍历 开始 的 E。 如 果 图 中 仍 存在 此 未 访问 过 的 就 另 
一 个 未 访问 过 的 绪 开始 经 几 从 守 流 守 过 万。 
可 见 ， 图 的 深度 优先 搜索 饥 历 是 一 个 递归 过 程 :: 其 特点 是 尽 可 能 先 对 纵深 方向 的 顶点 
进行 访问 。 
图 进行 深度 优先 搜索 遍历 时 ， 按 访问 顶点 的 先后 次 序 所 得 到 的 顶点 序列 ， 称 为 该 图 
的 深度 优先 搜索 遍历 序列 ， 简 称 为 DFS 序列 。 一 个 图 的 DFS 序列 不 一 定 唯一 ， 这 与 算法 、 
图 的 存储 结构 及 初始 出 发 点 有 关 。 
如 果 我 们 用 的 是 邻接 和 矩阵， 深度 优先 搜索 遍历 算法 可 表示 如 下 : 
算法 7.3 ”邻接 矩阵 的 深度 优先 搜索 遍历 


typedef struct 













































































只 





下 





将 








{ 
VertexType vexs [MAXVEX]; // 顶 点 表 
EdgeType arc[MAXVEX] [MAXVEX]; / /邻接 矩阵 ， 可 看 作 边 表 
int numVertexes, numEdges; // 图 中 当前 的 项 点数 和 边 数 
}MGraph; 
Boolean visited[MAXVEX]; // 访 问 标志 的 数组 
void DFS(MGraph G, int i) // 邻 接 矩 阵 的 深度 优先 递归 算法 
{ 
ne 
visited[i] = i; 
printf("%c ", G.vexs[i]); // 输 出 顶点 


for(G = 0; j < G.numVertexes; j++) 


if(G.arc[i][j] == 1 && !visited[j]) 


DFS(G, j); 
} 


// 对 未 访问 的 邻接 顶点 递归 调用 


对 于 无 向 图 7.12， 利 用 算法 7.3， 为 每 个 项 点 赋 了 一 个 数值 visited [v]， 顶 点 标 在 括号 


内 。 在 完成 所 有 必需 的 初始 化 后 调用 DFS(A)。 


(1) 第 一 次 用 顶点 A 来 调用 DFS( ); visited[A] 赋 值 为 1。A 有 4 个 邻接 项 点， 选择 顶 


点 了 进行 下 一 次 调用 。 为 这 个 顶点 赋值 2， 也 就 是 visited[E]=2。 
(2) 顶点 E 有 两 个 未 访问 的 相 邻 项 点 ， 先 用 第 一 个 顶点 下 调用 DFS( )。DFS(F) 调 


生 了 赋值 语句 num(D=3。 
(3) 顶点 只 有 一 个 未 访问 的 相 邻 项 点 I。 





























因此 ， 第 四 个 调用 DFS(D 产 生 赋 值 语句 














visited[]-4。 顶 点 工 的 相 邻 顶点 都 已 经 访问 过 了 。 因 此 ,返回 调用 SGE) 后 又 返 可 到 DFS(E), 





余下 的 执行 步骤 可 以 参阅 图 7.12(b)。 








这 里 只 es 不 为 0 就 表示 顶点 I 已 经 访问 过 了 ,<< 
这 里 只 要 知道 visited[]] 不 为 0 就 表示 顶 已 经 访问 过 了 XK 


了 


这 个 算法 保证 生成 一 个 树 (或 是 一 个 森林 ， 森林 主权 合 )， 它 包含 或 覆盖 了 原 图 的 
NSL 


所 有 项 点。 闪 
SN 








(b) 深度 优先 过 态 
7.12 无 向 图 的 深度 优先 搜索 遍历 














深度 优先 算法 的 复杂 度 是 O(|V|+|E) ， 因 为 


图 7.13 说 明了 算法 7.3 在 有 向 图 中 的 执行 过 程 。 





tment ) 
es 


(1) 为 每 个 顶点 v 初始 化 visited[v] 需 要 |v| 步 。 
(2) 为 每 个 顶点 v 调用 DFS(v) 共 n 次 ， 其 中 n 是 v 的 边 数 。 因 此 ， 调 用 次 数 是 |E|。 


过 








(a) 有 向 图 G 





KA 
Oo 
图 7.13 有 有 罗江 和 过 

如 果 图 结构 是 邻接 表 ， 其 的 代 由 了 相同 只 各 请 襄 西数 中 因为 将 区 组 的 成 了 
链表 有 些 不 同 。 代 码 见 算法 7 、 ,2 
算法 7.4 邻接 表 的 深度 优先 搜索 遍历 WL 


void a a NS // 邻 接 表 的 深度 优先 搜索 遍历 算法 
. Edg' le Ff 9 北 - 
i ] = TRUE; / 


printf("%c ",GL->adjList[i] .data); 
P = GL->adjList[i].firstedge; 
while(p) 
‘ 
if(!visited[p->adjvex]) 
DFS(GL, p->adjvex); // 对 未 访问 的 邻接 项 点 递归 调用 


P = p->next; 

} 
7.3.2 广度 优先 搜索 遍历 

设 图 G 的 初 态 是 所 有 顶点 均 未 访问 过 , 在 G 中 任 选 一 顶点 v 为 初始 出 发 点 , 则 广度 优 
先 搜索 遍历 的 基本 思想 是 : 从 指定 的 起 点 v 出 发 , 访问 与 它 相 邻 的 所 有 顶点 wi、w2… 然 后 
再 依次 访问 wi、w2… 邻 接 的 尚未 被 访问 的 所 有 顶点 , 再 从 这 些 顶 点 出 发 访问 与 它们 相 邻 接 
的 尚未 被 访问 的 顶点， 直到 所 有 顶点 均 被 访问 过 为 止 。 如 果 图 中 仍 存在 一 些 未 访问 过 的 结 
点 ， 就 另 选 一 个 未 访问 过 的 结 点 重新 开始 广度 优先 搜索 遍历 。 
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可 见 ， 图 的 广度 优先 搜索 遍历 不 是 一 个 递归 过 程 ， 其 特点 是 尽 可 能 先 对 横向 的 项 点 进 
行 访 问 。 

对 图 进行 广度 优先 搜索 遍历 时 ， 按 访问 顶点 的 先后 次 序 所 得 到 的 顶点 序列 ， 称 为 该 图 
的 广度 优先 搜索 遍历 序列 ， 简 称 为 BFS 序列 。 一 个 图 的 BFS 序列 不 一 定 唯一 ， 这 与 算法 、 
图 的 存储 结构 及 初始 出 发 点 有 关 。 如 果 我 们 说 深度 优先 搜索 遍历 类 似 树 的 前 序 遍 历 ， 那 么 
图 的 广度 优先 搜索 遍历 就 类 似 于 树 的 层次 遍历 。 

图 7.14 和 图 7.15 分 别 显示 了 处 理 一 个 无 向 图 和 一 个 有 向 图 的 例子 。 











久 y 六 图 7.15 有 后 国 所 广 庆 优 和 搜索 和 历 


邻接 矩阵 结构 的 广度 优先 搜索 遍历 算法 (以 队列 作为 基本 数据 结构 ) 见 算法 7.5。 
算法 7.5 ”邻接 矩阵 的 广度 优先 搜索 遍历 
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对 于 邻接 表 的 广度 优先 搜索 遍历 ， 代 码 与 邻接 矩阵 的 差 分 代码 见 算法 7.6。 
算法 7.6 邻接 表 的 广度 优先 搜索 遍历 





广度 优先 搜索 遍历 在 处 理 其 他 顶点 之 前 先 标记 顶点 v 的 所 有 相 邻 项 点， 而 DFS( ) 只 选 
择 v 的 一 个 相 邻 顶点 ， 即 先 不 去 处 理 v 的 其 他 相 邻 项 点， 而 是 去 找 所 选 的 这 个 相 邻 顶点 的 
相 邻 项 点。 这 样 ， 深 度 优先 搜索 遍历 更 适合 目标 比较 明确 ， 以 找到 目标 为 主要 目的 情况 ; 
而 广度 优先 搜索 遍历 更 适合 在 不 断 扩大 遍历 范围 时 找到 相对 最 优 解 的 情况 。 


7.4 ”最 小 生成 树 
图 论 中 ， 通 常 将 树 定义 为 一 个 无 回路 连通 图 。 对 于 无 回路 连通 图 ， 只 要 选 定 某 个 顶点 

作为 根 ， 以 此 项 点 为 树 根 对 每 条 边 定向 ， 就 能 得 到 通常 的 树 。 

7.4.1 生成 树 的 概念 


一 个 连通 图 G 的 子 图 如 果 是 一 棵 包含 G 的 所 有 项 点 的 树 ， 该 子 图 称 为 G 的 生成 树 。 
n 个 顶点 的 连通 图 G 的 任何 生成 树 一 定 是 包含 n 个 顶点 和 KK 4 连通 子 图 ( 称 为 G 的 
极 小 连通 子 图 )， 反 之 亦 然 。 
因为 树 被 视 作 一 个 无 回路 的 连通 图 , 一 个 包含 连通 图 至 少 含 n-1 条 边 (否则 






































不 连通 )， 另 外 ， 要 使 得 图 中 无 回路 则 从 多 包含 
从 以 上 表述 中 ， ed et 如 下 特点 ， 
(1) 如 果 在 生成 树 中 去 掉 任 何 一 条 过 ee 
(2) 任意 两 个 项 点 之 间 有 且 仅 7 条 径 ， 如 再 增加 一 条 边 ， 就 会 出 现 一 条 
ee 
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(3) 由 遍历 连通 图 G 时 所 多 i 














(b) DFS 生 成 树 (c) BFS 生 成 树 
图 7.16 生成 树 示例 


图 G 是 一 个 具有 nm 个 顶点 的 连通 图 , 则 从 G 的 任 一 顶点 出 发 , 作 一 次 深度 优先 搜索 遍 
历 或 者 广度 优先 搜索 遍历 ， 就 可 将 G 中 的 所 有 n 个 顶点 都 访问 到 。 显 而 易 见 ， 在 这 两 种 过 
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历 算法 中 ， 从 一 个 已 经 访问 过 的 顶点 遍历 到 一 个 未 曾 访问 过 的 邻接 点 ， 必 定 要 经 过 G 中 的 
一 条 边 ; 而 这 两 种 算法 对 图 中 的 mn 个 顶点 都 仅 访问 过 一 次 。 因 此 ， 除 初始 出 发 点 外 ， 对 其 
余 n-1 个 顶点 的 访问 一 共 要 经 过 G 中 的 n-1 条 边 ,这 n-1 条 边 将 G 中 的 n 个 顶点 连接 成 G 
的 极 小 连通 子 图 ， 从 而 得 到 G 的 一 棵 生成 树 。 

由 深度 优先 搜索 遍历 得 到 的 生成 树 称 为 深度 优先 生成 树 , 简称 为 DFS 生成 树 ; 由 广度 
优先 搜索 遍历 得 到 的 生成 树 称 为 广度 优先 生成 树 ， 简 称 BFS 生成 树 。 

于 从 图 的 遍历 可 求 得 生成 树 ， 如 果 将 生成 树 定义 为 :如果 从 图 的 某 个 顶点 出 发 ， 可 
以 系统 地 遍历 图 中 的 所 有 项 点 ， 则 遍历 时 所 经 过 的 边 和 图 的 所 有 项 点 所 构成 的 子 图 ， 称 为 
图 的 生成 树 。 这 样 ， 如 果 G 是 强 连通 的 有 向 图 ， 则 从 其 中 任何 一 项 点 v 出 发 ， 均 可 遍历 G 
中 所 有 顶点 ， 从 而 得 到 一 棵 以 v 为 根 的 生成 树 。 如 果 G 是 有 根 的 有 向 图 ， 设 根 为 顶点 1， 
则 从 根 1 出 发 也 可 完成 对 G 的 遍历 ， 从 而 得 到 G 的 以 顶点 1 为 根 的 生成 树 。 图 7.17 所 示 
是 以 顶点 1 为 根 的 有 向 图 及 其 DFS 生成 树 和 BFS 生成 树 。 - 
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(b) DFS 生 成 树 (c) BFS 生 成 树 
7.17 有 向 图 及 其 生成 树 


7.4.2 ”最 小 生成 树 的 概念 


对 于 连通 网 络 (图 7.18)，G=(V，E)， 其 边 是 带 权 的 ， 因 而 G 的 生成 树 的 各 边 也 是 带 权 
的 。 生 成 树 的 各 边 的 权 值 总 和 称 为 生成 树 的 权 , 并 把 权 最 小 的 生成 树 称 为 G 的 最 小 生成 树 。 

构成 最 小 生成 树 的 方法 有 多 种 。 这 些 算法 可 以 分 成 下 面 儿 类 。 

(1) 创建 并 扩展 一 些 树 ， 使 它们 合并 成 更 大 的 树 。 

(2) 扩展 一 个 树 的 集 构成 一 棵 生成 树 ， 如 Kruskal 算法 。 

(3) 创建 并 扩展 一 棵 树 ， 为 它 添加 新 的 树枝 ， 如 Prim 算法 。 

(4) 创建 并 扩展 一 棵 树 ， 为 它 添加 新 的 树枝 ， 也 可 能 从 中 删除 一 些 树枝 。 

无 论 哪 一 类 型 的 算法 均 用 到 了 最 小 生成 树 如 下 所 述 的 性 质 。 
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设 G=(V, E) 是 一 个 连通 网 络 ，U 是 顶点 集 V 的 一 个 真子 集 。 如 果 (u，v) 是 G 中 所 有 
的 一 个 端点 在 U( 即 ueU) 里 、 另 一 个 端点 不 在 U( 即 veV-U) 里 的 边 中 ， 具 有 最 小 权 值 
的 一 条 边 , 则 一 定 存在 G 的 一 棵 最 小 生成 树 包括 此 边 (u, v)( 图 7.19)。 这 个 性 质 称 为 MST 
性 质 。 

MST 性 质 用 反 证 法 证 明 如 下 : 

假设 G 的 任何 一 棵 最 小 生成 树 中 都 不 包含 边 (u, v)。 设 了 是 G 的 一 棵 最 小 生成 树 ，T 
不 包含 边 (u, v)。 由 于 T 是 树 ， 是 连通 的 ， 因 此 有 一 条 从 u 到 v 的 路 径 ; 而 且 该 路 径 上 必 有 
一 条 连接 两 个 顶点 集 U 和 V-U 的 边 (u, v)， 其 中 usU ，v'eV-U， 否 则 u 和 v 不 连通 。 
当 把 边 (u, v) 加 入 树 T 时 ， 得 到 一 个 包含 有 边 (u, v) 的 回路 ， 如 图 7.19 所 示 。 删 除 边 (uw, v)， 
上 述 回路 即 被 删除 ， 由 此 得 到 另 一 棵 生成 树 T。T' 和 T 区 别 仅 在 于 用 边 (uvV) 取 代 了 T 工 中 
的 边 (u, v)。 因 为 (u, V) 的 权 小 于 或 者 等 于 (ou v) 的 权 ， 所 以 了 的 权 小 于 或 者 等 于 T 的 权 。 
因此 ，T' 也 是 G 的 最 小 生成 树 ， 它 包含 边 (u, v)， 与 假设 矛盾 。 







































































图 7.19 包含 (u,v) 的 回路 


7.4.3” 普 里 姆 (Prim) 算 法 


设 G(V，E) 为 一 个 连通 网 ， 顶 点 集 V=(vi1，v2，…，ww}。 设 T(U，TE) 是 所 要 求 的 G 的 一 
棵 最 小 生成 树 ， 其 中 避 是 工 的 顶点 集 ，TE 是 工 的 边 集 ， 并 且 将 G 中 边 上 的 权 看 作 长 度 。 





o (ls 





数据 结构 与 算法 应 用 实 中 教程 第 Se 
aaa ， 


普 里 姆 (Prim) 算 法 的 基本 思想 : 首先 任 选 V 中 一 个 顶点 (不 妨 为 v)， 构 成 入 选 顶点 集 
U={v1}， 此 时 入 选 边 集 TE 为 空 集 ，V 中 剩余 顶点 构成 待 选 顶点 集 V-U:; 在 所 有 关联 于 入 
选 顶点 集 和 待 选 顶点 集 的 边 中 选取 权 值 最 小 的 一 条 边 (vi vi) 加 入 入 选 边 集 (这 里 vi 为 入 选 顶 
点 ，Vi 为 待 选 顶点 )， 同 时 将 wj 加 入 入 选项 点 集 ; 重复 以 上 过 程 ， 直 至 入 选 顶点 集 U 包含 
所 有 顶点 (U=V)， 入 选 边 集 包含 n-1 条 边 ，MST 性 质保 证 上 述 过 程 求 得 的 T(JU，TE) 是 G 
的 一 棵 最 小 生成 树 。 

显然 普 里 姆 算法 的 关键 是 如 何 找到 连接 U 和 V-U 的 最 短 边 来 扩充 生成 树 T。 一 个 简 
单 的 方法 就 是 在 实施 算法 之 前 ， 将 所 有 的 边 进行 排序 。 准 备 加 入 生成 树 的 边 不 仅 不 会 在 树 
中 产生 环 路 ， 而 且 也 和 树 中 己 有 的 一 个 顶点 关联 。 图 7.20 所 示 为 用 普 里 姆 算法 找到 的 一 棵 
最 小 生成 树 的 过 程 。 









(a) U={g, f} (b) U={g, f, d} 


(e) U={g, f, d, e, c¢, a} (f) U={8g,f,d, e, c, a,b} 
图 7.20 连通 网 络 利用 普 里 姆 算法 得 到 的 一 棵 生成 树 


普 里 姆 算法 的 代码 描述 见 算 法 7.7。 
算法 7.7 普 里 姆 算法 生成 最 小 生成 树 
void MiniSpanTree Prim(MGraph G) 
{ 





nt min Le 

int adjvex [MAXVEX]; // 保 存 相关 项 点 下 标 

int lowcost [MAXVEX]; // 保 存 相关 顶点 间 边 的 权 值 

lowcost[0] = 0; 

adjvex[0] = 0; 

for(i = 1; i < G.numVertexes; i++) / /循环 除 下 标 0 外 的 全 部 顶点 
lowcost[i] = G.arc[0] [i]; // 将 ve 顶点 与 之 有 边 的 权 值 存 入 数组 


adjvex[il = 0; 
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7.44 交 重 斯 卡尔 (ruskal] 算 法 NS 
ep 始终 选择 当前 可 用 的 最 小 权 


值 的 边 ， 具 体 

(1) 设 G=(V, E) 是 连通 网 络 , 令 最 小 生成 树 的 初始 状态 为 只 有 n 个 顶点 而 无 边 的 非 连 
通 图 T=(V,$)，T 中 的 每 个 项 点 自 成 一 个 连通 分 量 。 

(2) 按照 长 度 递增 的 顺序 依次 选择 E 中 的 边 (u,v)， 如 果 该 边 端 点 u、v 分 别 是 当前 T 
的 两 个 连通 分 量 Ti、T: 中 的 项 点， 则 将 该 边 加 入 到 T 中 ，T1 和 T, 也 由 此 边 连接 成 一 个 连 
通 分 量 : 如 果 u、v 是 当前 同一 个 连通 分 量 中 的 顶点 ， 则 舍 去 此 边 ， 这 是 因为 每 个 连通 分 量 
都 是 一 棵 树 ， 此 边 添加 到 树 中 将 形成 回路 。 

(3) 以 此 类 推 ， 直 到 工 中 所 有 项 点 都 在 同一 连通 分 量 上 为 止 ， 从 而 得 到 G 的 一 棵 最 小 
生成 树 T。 

同样 ， 在 这 个 算法 中 ， 所 有 的 边 都 是 根据 权 排序 的 ， 然 后 检测 这 个 排序 序列 中 的 每 条 
边 ， 如 果 在 构造 时 ， 加 入 它 不 会 产生 环 路 就 将 它 添加 到 树 中 。 

克 鲁 斯 卡尔 算法 代码 描述 见 算法 7.8。 

算法 7.8 克 鲁 斯 卡尔 算法 
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图 7.21 所 示 为 用 克 鲁 斯 卡尔 算法 找到 的 一 棵 最 小 生成 树 的 过 程 。 

克 鲁 斯 卡尔 算法 和 普 里 姆 算法 产生 的 生成 树 是 相同 的 ， 不 同 之 处 在 于 边 加 入 树 的 顺 
序 不 同 ， 而 且 普 里 姆 算法 总 是 保持 构造 中 的 树 是 一 片 的 ， 因 此 在 普 里 姆 算法 应 用 的 整个 
阶段 中 它 都 是 一 棵 树 。 克 和 鲁 斯 卡尔 算法 在 执行 过 程 中 不 能 保持 是 一 棵 树 ， 可 能 至 多 是 树 
的 集合 ， 但 是 每 条 边 在 克 鲁 斯 卡尔 算法 中 只 需要 考虑 一 次 ， 因 为 如 果 它 在 一 步 当中 产生 
环 路 ， 则 在 以 后 的 步骤 中 更 会 产生 环 路 ， 因 此 就 不 用 重复 考虑 了 。 从 这 里 可 以 看 出 殉 鲁 
斯 卡尔 算法 更 快 。 总 的 来 说 ， 普 里 姆 算法 适合 稠密 图 ， 克 鲁 斯 卡 算法 适合 稀疏 图 。 

最 小 生成 树 是 无 向 网 的 一 个 典型 应 用 。 下 面 分 别 介绍 最 短路 径 和 拓扑 排序 ， 它 们 是 有 
向 网 和 有 向 图 的 应 用 。 
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A 7.5 路 径 


带 权 图 中 求 最 短路 径 问 题 ， 即 求 两 个 顶点 间 长 度 最 短 的 路 径 ， 对 现实 生活 中 ， 如 交通 
网 络 问题 的 解决 具有 重要 的 意义 。 这 里 的 路 径 长 度 不 是 指 路 径 上 边 数 的 总 和 ， 而 是 指 路 径 
上 各 边 的 权 值 总 和 ， 这 里 的 权 值 可 以 代表 距离 、 运 费 等 具有 实际 含义 的 有 效 数 值 。 

设 A 城 到 B 城 有 一 条 公路 ， 两 座 城市 的 海拔 不 同 ，A 城 高 于 B 城 ， 这 样 如 果 考 虑 到 
上 、 下 坡 的 车 速 问题 ， 则 边 (A, B) 和 边 (B, A) 上 表示 行驶 时 间 的 权 值 也 不 同 ， 因 此 边 (A, B) 
和 边 (B，A) 应 该 是 两 条 不 同 的 边 。 这 里 约定 : 路 径 的 开始 顶点 称 为 源 点 ， 路 径 的 最 后 一 个 
顶点 称 为 终点 。 设 顶点 集 为 V={1, 2, …, n}， 并 假定 所 有 边 上 的 权 值 均 为 表示 长 度 的 非 负 
7.5.1 单 源 最 短路 径 问 题 


该 问题 是 指 对 于 给 定 的 有 向 网 络 G=(V, E) 及 单个 源 点 v， 求 从 v 到 G 的 其 余 各 顶点 的 
最 短路 径 。 
假设 图 7.22 所 示 的 有 向 网 表示 5 个 城市 之 间 的 航线 图 ， 顶 点 代表 城市 ， 弧 上 的 权 值 代 
































表 运 输 费用 ， 现 在 要 求 从 某 一 个 城市 到 其 他 各 城市 的 最 小 运输 费用 。 这 实际 上 就 是 求 有 向 
网 的 最 短路 径 问 题 ， 即 单 源 最 短路 径 问 题 。 





图 7.22 有 向 网 络 。 1 


在 722 中 ， 滴 训 1 为 点，1 到 的 站 只 有 家 1-200) 括 时 的 
该 路 径 上 的 权 值 之 和 ， 称 作 路 径 长 度 ; ,六 

1 到 3 的 路 从 有 2 条 123(60)，1-4 -30D 

到 4 的 路 径 有 1 条 : 1-4(30); 。 >， 

1 到 5 的 路 径 有 4 条 : 1 S000). Id sg) 1 一 2 一 3 一 5(70)，1 一 4 一 3 一 5(60)。 

选 出 1 到 其 余 各 顶点 的 最 短路 径 \ 开 按 路 径 长 度 递增 顺序 排列 如 下 ; 1-2010)， 
1 一 430)，1 一 4-3650)，1 一 4-35(60)。 效 

此 可 以 发 现 一 个 规 短 ; 按 路 径 长 度 闻 增 顺 序 东 成 从 源 点 到 其 余 各 顶点 的 最 短路 和 
时 ， 当 前 正 生成 的 最 短路 径 上 除 终点 以 外 ， 其 余 项 点 的 最 短路 径 均 已 生成。 

过 卡 斯 特 拉 (Dikstra) 算 法 正 是 在 上 述 规律 基础 得 到 的 。 其 基本 思想 是 ， 设 置 两 个 顶 
点 集 S 和 T'S 中 存放 已 确定 最 短路 径 的 项 点 > 了 中 存放 待 确定 最 短路 径 的 项 点。 初始 时 
S 中 仅 有 一 个 源 点 ;T 中 包含 除 源 点 外 的 项 点 ， 此 时 各 项 点 的 当前 最 短路 径 长 度 为 源 点 到 
该 顶点 的 弧 上 的 权 值 。 接 着 选取 了 中 当前 最 短路 径 长 度 最 小 的 一 个 顶点 加 入 S， 然 后 修 
改 了 中 剩余 项 点 的 当前 最 短路 径 长 度 ， 修 改 的 原则 是 : 当 v 的 最 短路 径 长 度 与 v 到 T 中 的 
质点 之 间 的 权 值 之 和 小 于 该 项 点 的 当前 最 短路 径 长 度 时 ,用 前 者 蔡 换 后 者 。 重 复 上 述 过 程 ， 
直至 $ 中 包含 所 有 的 顶点。 

图 7.23 所 示 给 出 了 图 7.22 中 有 向 网 络 从 项 点 1 到 其 他 各 项 点 最 短路 径 的 过 程 ， 图 中 
j 实 线 轿 表示 已 确定 最 短路 径 的 项 点， 实 线 箭头 表示 已 确定 距离 的 最 短路 径 上 的 弧 ， 项 点 
过 括号 中 的 数字 表示 该 项 点 的 当前 最 短路 径 长 度 。 

过 卡 斯 特 拉 算法 举例 ; 

如 图 7.24 所 示 ， 求 从 顶点 0 到 其 余 各 项 点 的 最 短路 径 。 

(1) 将 有 向 网 络 用 邻接 矩阵 表示 ， 即 用 权 值 代 蔡 邻 接 邱 阵 中 原来 的 1， 无 权 值 的 边 可 
oo 来 表示 ， 如 图 7.25 所 示 。 
(2) 算法 中 需要 一 个 顶点 集合 S, 初始 时 其 中 只 有 一 个 源 点 ， 以 后 陆续 将 已 求 得 的 最 短 
路 径 的 顶点 加 入 到 该 集合 中 ， 当 全 部 顶点 进入 集合 后 算法 结束 。 可 用 一 维 数组 代替 集合 ， 
集合 外 顶点 vi 对 应 数组 S[] 值 为 0， 集合 内 顶点 vi 对 应 数组 S[j] 值 为 1 。 
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图 7.24 迪 卡 斯 特 拉 算 法 举例 


图 7.25 有 向 网 络 的 邻接 矩阵 


G) 设 数组 dist 存放 最 短路 径 ， 每 当 一 个 项 点 进入 集合 8 时 就 要 修改 此 数组 中 的 最 短 
路 径 (这 些 都 是 中 间 结果 )， 当 最 后 一 个 顶点 进入 集合 S， 再 修改 完 dist 中 的 值 ， 即 得 到 茶点 
到 各 点 的 最 短路 径 。 

迪 卡 斯 特 拉 算法 过 程 如 图 7.26 所 示 。 

根据 前 述 ， 迪 卡 斯 特 拉 算 法 的 代码 描述 见 算法 7.9， 首 先 求 有 向 网 G 的 vo 顶点 到 其 余 
顶点 v 的 最 短路 径 P[v] 及 其 带 权 长 度 DIv]。 其 中 ，P[v] 的 值 为 前 趋 顶 点 下 标 ，D[v] 表 示 vo 
到 v 的 最 短路 径 长 度 和 。 
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算法 7.9 迪 卡 ; 
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CC Oo 


k=w; 
min = (*D)[w]; //w 顶点 离 vo 顶点 更 近 
} 
finallk] = 1 
for(w=0; w<G.numVertexes; w++) // 修 正当 前 最 短路 径 及 距离 
{ 
/* 如 果 经 过 v 顶点 的 路 径 比 现在 这 条 路 径 的 长 度 短 的 话 */ 
if(!final[w] && (min+G.arc[k] [w]<(*D)[w])) 
| 
(*D)[w] = min + G.arc[k] [w]; 
(*P)[w]=k; 


} 
) < 
7.5.2 每 一 对 顶点 之 间 的 最 短 距离 KX 


顶点 对 之 间 的 最 短路 径 是 指 对 于 给 定 的 > 舍 =(V E), 要 对 G 中 任意 一 对 顶点 有 序 
对 (w v)(vi#v)， 找 出 w 到 的 最 短 距离 和 到 w 的 最 短 距离 。 

解决 此 问题 的 一 个 有 效 方法 是 :轮流 由 每， 个 顶点 为 fe 重复 执行 迪 卡 斯 特 拉 算 法 
n 次 ， 即 可 求 得 每 一 对 顶点 之 间 的 最 短路 径 ， 总 的 时 间 5 OO)。 
弗 洛 伊 德 (Floyd) 提 出 了 另外 一 个 求 图 中 任意 两 as 虽然 其 时 间 
复杂 度 也 是 Oo )， 但 其 算法 的 形式 更 简单 ， MS 和 编程 。 


让 沪 治 伊 德 和 法 基本 思想 不 2 


~ jo arc[nj[n] 来 存储 带 权 有 向 图 。 算法 的 基本 思想 是 : 设 
置 一 个 nxn 的 矩阵 As， 其 中 除 对 角 线 的 元 素 都 等 于 0 外 ， 其 他 元 素 Axi][j] 表 示 顶 点 站 到 
顶点 j 的 路 径 长 度 ，k 表示 运算 步 又。 开始 时 ， 以 任意 两 个 顶点 之 间 的 有 向 边 的 权 值 作为 
路 径 长 度 ， 没 有 有 向 边 时 ， 路 径 长 度 为 ， 当 k=0 时 ，Ao[i][]=arc[i]j]， 以 后 逐步 尝试 在 
原 路 径 中 加 入 其 他 顶点 作为 中 间 顶 点 ， 如 果 增 加 中 间 顶 点 后 ， 得 到 的 路 径 比 原来 的 路 径 长 
度 减 少 了 ， 则 以 此 新 路 径 代 替 原 路 径 ， 修 改 矩 阵 元 素 。 有 具体 做 法 如 下 : 

第 一 步 ， 让 所 有 边 上 加 入 中 间 顶 点 1， 取 A? 中 与 A'[[]+A"[]D] 中 较 小 的 值 作 为 
A 向 中 的 值 ， 完 成 后 得 到 A' 。 

第 二 步 ， 让 所 有 边 上 加 入 中 间 顶 点 2， 取 A 和 四 与 AD[2]+A:[2][] 中 较 小 的 值 ， 完 成 
后 得 到 A?。 

如 此 进行 下 去 ， 当 第 n 步 完成 后 ， 得 到 A"，A" 即 我 们 所 求 结果 ，A"[i] 虽 表示 顶点 i 
到 顶点 j 的 最 短 距离 。 

因此 ， 弗 洛 伊 德 算法 可 以 描述 如 下 : 

Ro[i]l[j]=arc[i][j]， /Varc 为 图 的 邻接 矩阵 

Rax[il [j]=min{A® [i][j], A [i][k]+A® [k] [j]} 


司 。 





} 






































6 TN 
其 中 ;k=1，2,…，1n。 


进一步 地 ， 我 们 定义 一 个 n 阶 方 阵 序列 : 
和 于 4 Du"， ss De 
其 中 ,D7 和 [j=arc[0]; D'EGj=min{D 和], DY K+D™ [KG]}, k=0, 1, *, nl。 
那么 ，D" 上 j] 是 从 顶点 i 到 j， 中 间 项 点 是 Vo 的 最 短路 径 的 长 度 ，D* 和 中 是 从 顶点 i 到 j， 
中 间 顶 点 的 序号 不 大 于 k 的 最 短路 径 长 度 ，D"™I[] 中 是 从 顶点 i 到 j 的 最 短路 径 长 度 。 
为 了 理解 弗 洛 伊 德 算法 ,我 们 先 来 看 看 图 7.27 所 示 的 网 图 ， 这 是 一 个 最 简单 的 3 个 项 
点 连通 网 图 。 














SS > 

V0 -92 , A&I 0) 2 
PVA Yh 
图 7.27 3 顶点 连通 网 图 的 弗 洛 仇 德 算法 示意 图 


我 们 先 定义 两 个 三 维 数组 DI Bj, D- 代表 顶点 到 顶点 的 最 短路 径 权 值 和 
的 矩阵 。P- 形 对 应 项 点 的 最 小 路 径 的 前 趋 矩阵 。 在 未 分 析 任何 顶点 之 前 ，D” 就 是 初始 
的 图 的 邻接 矩阵 ”了 P- 初始 化 为 图 7.27 中 所 示 的 矩阵 。 

首先 , 我 们 来 分 析 所 有 的 顶点 经 过 vo 后 到 达 另 一 顶点 的 最 短路 径 。 因为 只 有 3 个 顶点 ， 
因此 只 需要 查看 vi->vo->v, 得 到 D7[1][0]+D7[0][2]=3+2=5。D7[1][2] 表 示 v1->v 的 权 值 
为 7， 我 们 发 现 DT][2]}>D-I1][o0]+D-Io[2] ， 所 以 我 们 就 让 D7[1][2]=D7[1][0] 
+D-'[0][2]=5， 同 样 有 D7'[2][1]=5， 于 是 训 有 了 D" 的 矩阵 ， 于 是 P 一 和 矩阵 对 应 的 PM[1][2] 
和 Pr[2][1] 也 修改 为 当前 中 转 的 顶点 vo 的 下 标 0， 于 是 就 有 了 P"。 

接 下 来 ， 在 D" 和 P? 的 基础 上 继续 处 理 所 有 顶点 经 过 vi、vz 后 到 达 另 一 顶点 的 最 短路 
径 ， 得 到 D! 和 P!、D? 和 P?， 完 成 所 有 项 点 到 所 有 项 点 的 最 短路 径 计算 工作 。 

2， 弗 洛 伊 德 算法 的 实现 


为 了 进一步 说 明 弗 洛 伊 德 算 法 ， 下 面 以 复杂 网 图 为 例 来 讲解 弗 洛 伊 德 算法 。 

首先 我 们 针对 图 7.28(a) 准 备 两 个 矩阵 D” 和 P,，D7 就 是 网 图 的 邻接 矩阵 , P71 初 设 为 
P70j]=j 这 样 的 矩阵 ， 主 要 用 来 存储 路 径 。 

其 相关 代码 见 算法 7.10， 该 算法 最 后 得 到 网 图 G 中 所 有 顶点 到 所 有 顶点 的 最 短路 径 。 
P[v][w] 是 任意 项 点 v 到 其 余 项 点 w 的 最 短路 径 ，D[v][w] 是 任意 项 点 v 到 其 余 顶 点 w 的 最 
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短 带 权 路 径 长 度 。 如 果 经 过 下 标 为 k 的 顶点 路 径 比 原 两 点 间 路 径 更 短 ， 将 当前 两 点 间 权 值 
设 为 更 小 的 一 个 。 








AN 


-1 

和 了 
vil20265 cco co co 4567 8 
vs 20col5coco 45678 
ws51103567= 4 
vcsc50co6oc 4 56 7 8 
w= = 46~03 8 45678 
wm 7633 45678 
We mm ~ wp, 0 二 和 

亿 D WX (ec) Pp 


7 sean 


ns 


O 加 


if ((*D)[v] [w]>(*D)[v] [k]+(*D)[k]l [w]) 
{ 
(*D)[v] [w]=(*D)[V] [k]+(*D)[k] Cw]; 
(*P)[v] [w]=(*P)[V] [k]; 





} 

为 了 使 大 家 对 上 述 算法 有 更 好 的 理解 ， 现 分 析 如 下 : 

(1) 第 7 一 14 行 初始 化 D 和 了 为 图 7.28 所 示 的 两 个 矩阵 。 

(2) 第 15 一 28 行 是 算法 的 主 循环 ， 一 共 3 层 嵌 套 ，k 代表 中 转 项 点 的 下 标 。v 代表 起 
始 顶点 ，w 代表 结束 顶点。 全 

(3) 当 k=0 时 ， 也 就 是 所 有 的 顶点 都 经 过 vo(v=0) 中 转 ， 计算 否 有 最 短路 径 的 变化 ， 
结果 如 图 7.29 所 示 。 | 
(4) 当 k=1 时 ， 也 就 是 所 有 的 顶点 都 经 过 vi 中 
在 由 于 D'[ol[I+D'"[I[2]=4， 因 此 D'[0][2]=4， 





时 ， 当 v=0 时 ，D?[o][2]=5， 现 
可 得 D'[0][3]=8，D'[0][4]=7， 当 v=2 
小 权 值 的 修正 ， 所 以 在 路 径 和 矩阵 P 上 ， 





























时 ,DI'[2][3]=8, v 为 其 他 值 时 没有 改变 。 由 于 
也 要 作 处 理 ， 将 它们 都 改 为 当前 的 Rg 结果 如 图 7.30 所 示 。 
DV WV ww VW NN V3 V4 Vs Vo_Vy 
2 | [| Cr 
wllalo 2 6 se = 人 人 
vsl2 0 oT 5 ~ mm 3 4 567 
vel6 2 0 2 42%~ :EE 
24 AN 
ola) s AXr 0 s 6 1 sly 345567 
rr 了 
| i 3 4567 
vl 4 6-0 38 3 45567 
wl2 ~ -7 6303 人 
ve mmm m8 30 34567 


























Divo [vi v3 va vs ve vi vs Pi vo Fi ve va va Vs Ve Vv Vs 
Wh” wfo BUDms 67 
Mi 2 2 J 
wl2 oR 5 2 oo :| 中 | 下 2 5 6 7 
vB Bo0 1 ~ 4 mo wm 5 6 7 
v 四 05637 志 wmlil 2 5 6 7 
bi bl 过 本 有 下 四 vol 2 5 6 7 
vil 王 46”03 8 vel0 II 2 -| 
ve” °° 7 6 303 wo Ill2 5 6 7 
ve l= -~-- 8 3 wo li 2 家 区 ' 字 

















7.30 ”第 二 次 迭代 后 的 D、P 和 矩阵 
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(5) 接 下 来 就 是 k=2， 一 直到 8 结束 , 表示 针对 每 个 顶点 作 中 转 得 到 的 计算 结果 ， 其 中 


D? 以 D- 为 基础 ，D' 以 D" 为 基础 ……D? 以 D 为 基础 ， 路 径 窍 阵 P 也 是 如 此 。 最 终 当 k=8 
时 ， 两 矩阵 数据 如 图 7.31 所 示 。 


























Ds wwvwwwwww PEvvwvvwwwwww 敬 
vw/0 2465 9 10 vf0 11111L1 1 1 
罗 |2 V0 122222 2 加 
| 第 各 座 - 人 年 谊 者 vl 124 4 5 4 4|4 
w|iI6 4 2 0 1 6 4 vi|I4 4 4 3 44 6 616 
Wl vl22234353 7 图 
| vlI222445 7 7 圈 
“ll0 8 6 4 5 9 0 vil3333r3 76 7 图 
的 | 0 | 站 5 6 7|8 
上 val7 Ra ENTE 
(a) 4 J | (b) 
图 7.31 D、 Pt 果 





至 此 ， 最 短路 径 就 算 完成 了 。 mana 都 可 以 
计算 出 。 /A 玉 

那么 如 何 由 了 这 个 路 和 数组 得 出 记 信 的 虽 短 路 各 吧 ? 以 w 到 vs 为 例 ， 从 图 731(b) 第 w 
列 ，P*[OJ[8]=1， 得 到 要 经 过 项 点 Ww 然后 将 1 取代 0， 得 到 [1][8]=2， 说 明 划 经 过 va， 然后 
将 2 取代 1， 得 到 PM2][8]=4 直 说 明朗 经 过 vs， 然后 2 得 到 P"[4][8]}-7， 说 明 要 经 过 
v7， 再 得 到 Ps[7][8]=8， 样 很 容 ep 径 值 为 vo->vi->vz-> Va->V1->V8。 
洛 伊 德 算法 的 代码 就 是 一 个 二 重 循环 初始 化 加 一 个 三 重 循环 权 值 修正 ， 就 完成 了 所 
有 项 点 到 所 有 项 点 的 最 短路 径 计算 。 如 果 要 求 所 有 项 点 到 所 有 项 点 的 最 短路 答 问 题 ， 洛 
伊 德 算法 应 该 是 不 错 的 选择 。 | 


























[4 
a 
虽然 对 求 最 短路 径 的 两 个 算法 举例 都 是 无 向 图 ， 但 它们 对 有 向 图 依然 有 效 ， 因 为 两 
者 的 差异 仅仅 是 邻接 矩阵 是 否 对 称 而 已 。 






7.6 拓扑 排序 








前 面 介 绍 了 有 环 的 图 应 用 ， 现 在 我 们 来 谈 谈 无 环 (无 回路 ) 的 图 应 用 。 在 现实 世界 中 ， 
需要 执行 一 系列 任务 。 一 些 任务 关系 到 先 执行 哪 一 个 ， 而 另 一 些 任务 的 执行 顺序 就 无 关 紧 
要 。 例 如 ， 对 于 房地产 项 目 ， 可 以 用 一 个 有 向 图 来 描绘 其 实施 过 程 。 显 然 这 个 房地产 项 目 
可 以 由 若干 个 子 工程 或 子 系统 构成 ， 如 果 把 子 工程 或 子 系统 称 为 活动 (activity)， 这 些 活动 
之 间 就 存在 先后 次 序 关系 ， 即 某 项 活动 的 实施 必须 以 另 一 项 活动 的 完成 为 前 提 。 

我 们 可 以 用 一 个 有 向 图 的 顶点 代表 一 项 活动 ， 用 有 向 图 的 弧 代表 活动 之 间 的 先后 次 序 关 
系 ， 即 弧 代 表 先 决 条 件 ， 当 一 项 活动 i 是 男 一 项 活动 j 的 先决 条 件 时 ， 有 向 图 中 存在 边 <i, j>。 
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用 项 点 表示 活动 ， 用 弧 表 示 活 动 之 间 的 先后 次 序 关 系 的 有 向 图 ， 称 为 项 点 活动 图 
(Activity On Vertex network)， 简 称 为 AOV 网 。 可 见 AOV 网 的 特点 是 在 网 中 一 定 不 能 有 有 
向 回路 。 检 测 网 中 是 否 存在 环 ， 则 采用 拓扑 排序 的 方法 。 回回 


7.6.1 拓扑 排序 的 概念 
































对 于 一 个 AOV 网 ， 通 常 需要 把 它 的 所 有 项 点 排 成 一 个 满足 下 述 关系 的 线 【参考 图 文 】 
性 序列 Vi，V2，…，Vns。 如 果 AOV 网 中 从 顶点 Vi 到 顶点 Vj 有 一 条 路 径 ， 则 在 该 线性 序 
列 中 顶点 Vi 必 在 顶点 Vi 之前。 满足 这 种 线性 关系 的 序列 称 为 拓扑 序列 。 
对 AOV 网 构造 拓扑 序列 的 操作 称 为 拓扑 排序 , 即将 AOV 网 中 各 个 顶点 排列 成 一 个 有 
序 序列 ， 使 得 所 有 前 趋 和 后 继 关系 都 能 得 到 满足 ， 而 那些 没有 次 序 关系 的 项 点 ， 在 拓扑 排 
序 的 序列 中 可 以 插 到 任意 位 置 .拓扑 排序 是 对 非 线形 结构 的 有 向 图 进行 线形 化 的 重要 于 段 。 
并 非 任 何 AOV 网 的 顶点 都 可 以 排 成 拓扑 序列 。 me 向 回路 ， 则 找 不 到 该 
网 的 拓扑 序列 。 一 般 情况 下 ，AOV 网 不 应 该 存在 有 向 回路 忆 为 如 果 存 在 回路 就 意味 着 某 
项 活动 的 开工 是 以 自己 工作 的 完成 为 先决 条 件 的 ， a, 
对 AOV 网 进行 拓扑 排序 的 基本 思路 是 从 AOV 网 中 选择 一 个 入 度 为 0 的 顶点 输出 ， 然 
后 删除 该 项 点， 并 出 除 以 此 顶点 为 尾 的 听 ， 继 续 重复 此 步骤 ， 直到 输出 全 部 顶点 或 者 AOV 
网 人 



































(a) 有 向 图 G 
CO ©) ©) 
Spee 
一 地 @ @ @ (OO © 
(b) 取 顶 点 3 (0) 取 顶 点 1 (d) 取 顶 点 4 (ej 取 顶点 5 (f) 取 顶 点 2 


图 7.32 拓扑 排序 示例 


(1) 在 图 7.32(a) 所 示 的 有 向 图 中 选取 入 度 为 0 的 项 点 3， 删除 3 及 其 相关 联 的 两 条 弧 ， 
如 图 7.32(b) 所 示 。 

(2) 在 图 7.32(b) 中 选取 入 度 为 0 的 顶点 1， 删除 1 及 其 相关 联 的 两 条 弧 ， 如 图 7.32(c) 

(3) 在 图 7.32(c) 中 选取 入 度 为 0 的 顶点 4， 删 除 4 及 其 相关 联 的 一 条 弧 ， 如 图 7.32(d) 
所 示 。 















































oo 


数据 结构 与 算法 应 用 实践 教程 (第 己 7 
ea 


(4) 在 图 7.32(d) 中 选取 入 度 为 0 的 顶点 5， 删除 5 及 其 相关 联 的 两 条 弧 ， 如 图 7.32(e) 所 示 。 

(5) 在 图 7.32(e) 中 选取 入 度 为 0 的 顶点 2， 删除 2 及 其 相关 联 的 一 条 弧 ， 如 图 7.32(D 所 示 。 

(6) 最 后 选取 顶点 6， 得 到 有 向 图 的 一 个 拓扑 序列 : 3，1，4，5，2，6。 
7.6.2 ”拓扑 排序 的 算法 

为 了 实现 拓扑 排序 ， 我 们 首先 需要 给 出 AOV 网 的 数据 结构 。 前 面 求 最 小 生成 树 和 最 
短路 径 时 ， 我 们 用 的 都 是 邻接 矩阵 ， 但 由 于 在 拓扑 排序 的 过 程 中 ， 需 要 删除 顶点， 显然 用 
邻接 表 会 更 加 方便 些 。 考 虑 到 排序 过 程 中 始终 要 查找 入 度 为 0 的 顶点 ， 我 们 在 原来 的 顶点 
表 结 点 结构 中 增加 了 一 个 入 度 域 inDegree。 结 构 如 图 7.33 所 示 ， 其 中 headEdge 是 边 表 头 
指针 ，data 是 项 点 域 中 存储 的 顶点 信息 。 

a 


图 7.33 项 点 表 结 点 结构 AK 
因此 ， 对 于 图 7.34(a) 所 示 的 AOV 网 ， RM 
SN 



























(a) ov 
adjvex next 


XN 


AN 
i Degreg data headEdge 











(b) 对 应 AOV 网 的 邻接 表 
7.34 AOV 网 及 其 邻接 表 


在 拓扑 排序 算法 中 ， 涉 及 的 结构 代码 如 下 : 


typedef struct EdgeNode // 边 表 结 点 
{ 
int adjvex; // 邻 接点 域 ， 存 储 该 项 点 对 应 的 下 标 


2 © 


其 算法 描述 见 算法 7.11。 其 中 ， 若 GL 无 出 拓扑 排序 序列 并 返回 ， 若 有 回 
路 则 返回 。 ide 储 处 理 过 程 中 入 度 为 0 的 项 点。 其 目 
入 度 项 点 为 0 的 顶点 。 


局 


算法 7.11 拓扑 排序 的 算法 





数据 结构 与 算法 应 用 实践 教程 第 版 /7 


printf("\n"); 

if(count < GL->numVertexes) // 车 count 数 小 于 顶点 数 ， 存 在 环 
return ERROR; 

else 
return OK; 





任何 无 回路 的 AOV 网 ， 其 顶点 都 可 以 排 成 一 个 拓扑 序列 ， 并 且 拓 扑 序列 不 一 定 是 





7.7 关键 路 径 痛 


若 以 弧 表 示 活 动 ， 且 弧 上 的 权 值 表示 进行 该 项 活动 NY 而 以 顶点 表示 “事件 ”， 
称 这 种 有 向 图 为 活动 在 弧 上 的 网 络 ， 简 称 活动 边 ba AOE 网 (Activity On Edge 
network)。 ri 指向 它 的 弧 表示 的 活动 已 
经 完成 ， 而 从 它 出 发 的 弧 表 示 的 活动 开始 整个 有 向 网 也 表示 了 活动 之 间 的 
优先 制约 关系 ， 显然 ， ee 允许 存在 有 向 环 的 ， 除 此 之 外 ， 工 程 的 负 
2 阅 及 哪些 子 工程 交 村 影响 整个 工程 如 期 完成 的 关 
键 所 在 。 
图 7.35 所 示 为 表示 项 寡 各 的 AOE 网 络 | et i(i=1,2,…,11) 项 活动 ， 
WA 示 整 个 工程 开始 的 事件 , k 表示 整个 
结束 的 事件 ，e- 则 表示 活动 ai 继而 a4 和 活动 2 继而 as 完成， 同时 活动 ay 和 as 开始 进 
行 的 事件 。 电工 和 人 人 的 硕 上 关上 为 和 (了 人 尖 ) 表示 工程 结束 事件 的 项 
点 的 出 度 为 过 : 汇 点 ), 一 个 工程 的 AOE 网 应 是 只 有 一 个 单 源 点 和 单 汇 点 的 有 向 无 环 图 。 
AOB 网 将 告诉 人 们 该 项 工程 从 开始 到 完成 需要 18 天 ， 其 中 al、a4、as 和 al 这 4 项 子 工程 
必须 按时 开始 并 计划 完成 ， 否 则 将 延误 整个 工程 的 工期 ， 即 整个 工程 不 能 在 18 天 内 完成 。 
和 a4、as 和 all 为 此 AOE 网 的 关键 活动 ， 称 由 它们 构成 的 路 径 {a1,a4,as,al1} 为 关键 路 径 。 














图 7.35 AOE 网 


在 AOE 网 络 中 ,一 条 路 径 上 各 弧 权 值 之 和 称 为 该 路 径 的 带 权 路 径 长 度 。 由 于 AOE 
中 某 些 活动 可 以 并 行进 行 ， 则 完成 整个 工程 的 最 短 时 间 为 从 源 点 到 汇 点 最 长 的 带 权 路 径 长 


司 
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度 的 值 ， 这 条 路 径 便 称 为 关键 路 径 ， 构 成 关键 路 径 的 弧 即 关键 活动 。 

相应 的 关键 路 径 的 代码 见 算法 7.12, 其 中 ete 和 lte 分别 是 活动 最 早 发 生 时 间 变 量 和 最 
迟 发 生 时 间 变 量 ，GL 为 有 向 网 ， 输 出 G 的 各 项 关键 活动 。 

算法 7.12 关键 路 径 
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7.8 应 用 实践 


7.8.1 单 源 点 最 短路 径 问题 


设 图 用 邻接 表 表 示 ， 写 出 求 从 指定 顶点 到 其 余 各 顶点 的 最 短路 径 的 迪 卡 斯 特 拉 算法 。 
要 求 : 对 所 用 的 辅助 数据 结构 ， 用 邻接 表 结 构 给 以 必要 的 说 明 ;， 写 出 算法 描述 。 

解 : 这 是 一 个 求 单 源 点 最 短路 径 问 题 。 存 储 结构 用 邻接 表 表 示 ， 这 里 先 给 出 所 用 的 邻 
接 表 中 的 边 结 点 的 定义 : 





7.8.2 ”自由 树 的 直径 问题 
自由 树 ( 即 无 环 连通 图 )T=(VE) 的 直径 是 树 中 所 有 点 对 间 最 短路 径 长 度 的 最 大 值 ， 即 T 
的 直径 定义 为 MAX D(uv), 这 里 Dtuv) (wvEV) 表 示 顶 点 u 到 顶点 v 的 最 短路 径 长 度 (路 
径 长 度 为 路 径 中 所 包含 的 边 数 )。 写 一 算法 求 的 直径 ， 并 分 析 算法 的 时 间 复 杂 度 。 
解 ， 对 于 无 环 连通 图 ， 顶 点 间 均 有 路 径 ， 本 
子 间 的 距离 ， 利 用 深度 优先 搜索 遍历 可 求 出 图 的 直径 。 


根 结 点 最 远 的 两 个 叶 
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算法 主要 过 程 是 对 图 进行 深度 优先 搜索 遍历 。 若 以 邻接 表 为 存储 结构 ， 则 时 间 复杂 度 
为 Oo+e)。 - 
7.8.3 ”医院 选 址 问题 vvA 险 

给 定 了 个 村 庄 之 间 的 交通 图 ， 若 村 庄 i 和 j 之 间 有 道路 则 将 项 点 i 和 j 用 边 连 接 ， 边 
上 的 Wi 表示 这 条 道路 的 长 度 ， 现 在 要 从 n 个 村 庄 中 选择 一 个 村 庄 建 一 所 医院 ， 问 这 所 医 
让 应 于 在 友人 村 庄 ,才能 使 高 医院 最 远 的 村 庄 到 光 隐 只得 最 短 ? 试 设计 一 个 解答 上 述 问题 
的 算法 ， 并 应 用 该 算法 解答 图 7.36 所 示 的 实例 。。 l 


RS 





7.36 ”交通 图 


解 : 医院 选 址 问题 可 用 求 每 对 顶点 间 最 短路 径 的 弗 洛 仇 德 算法 求解 。 求 出 每 一 顶点 (村 
庄 ) 到 其 他 顶点 (村 庄 ) 的 最 短路 径 。 在 每 个 顶点 到 其 他 顶点 的 最 短路 径 中 , 选 出 最 长 的 一 条 。 
因为 有 nm 个 顶点 ， 所 以 有 n 条 , 在 这 n 条 最 长 路 径 中 找 出 最 短 的 一 条 ， 它 的 出 发 点 (村 庄 ) 
就 是 医院 应 建立 的 村 庄 。 
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G ee 


for (j=1;j<=n;j++) // 求 从 某 村 庄 i(1<=i<=n) 到 其 他 村 庄 的 最 长 路 径 
if (w[i][j]>s) 
s=w[i] [j]; 
if (s<=m) 
{ 
m=s? 
k=i; 
有 // 在 最 长 路 径 中 ， 取 最 短 的 一 条 。m 记 最 长 路 径 ，k 记 
出 发 顶点 的 下 标 
Printf(" 医 院 应 建 在 $d 村 庄 , 到 医院 距离 为 $d\n", i, m); 





} 

} // 算 法 结束 ge 

对 以 上 实例 模拟 的 过 程 略 。 运 用 该 算法 ， 最 终 确定 该 医院 谋 在 第 三 个 村 庄 中 
院 最 远 的 村 庄 到 医院 的 距离 是 6。 和 | 
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图 是 一 利 eet 在 线性 表 中 , 数据 元 素 之 间 仅 有 线性 关系 ， 
数据 元 素 只 有 一 个 直接 前 趋 和 二 个 直接 后 继 。 在 树 形 结构 中 ， 数 据 元 素 之 间 存在 着 明 
层次 关系 ， 并 且 每 层 的 元 素 可 能 和 下 一 层 的 多 个 元 素 ( 孩子 结 点 ) 相 邻 ， 但 只 能 和 
一 层 的 一 个 元 素 ( 即 其 双 业 结 点 ) 相 关 。 而 在 图 形 结构 中 ， 绪 点 之 间 的 关系 可 以 是 任意 的 ， 
中 任意 两 个 元 素 之 问 都 可 能 相 邻 A 

和 树 类 似 ， 图 的 是 图 的 一 种 主要 操作 ,可 以 通过 遍历 判别 图 中 任意 两 个 项 点 之 间 
oie ng 但 对 于 网 ( 带 
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权 图 ) 来 说 , 其 最 小 生成 树 或 最 短路 径 都 取决 于 弧 或 边 上 的 权 值 , 则 需要 有 特定 的 算法 求解 。 
习题 与 思考 
7.1 单 选 题 
1. 设 无 向 图 的 顶点 个 数 为 n， 则 该 图 最 多 有 ( ”) 条 边 。 
A. n-l B. n(n-1)/2 C. n(nt1)/2 D. 0 
2. n 个 结 点 的 完全 有 向 图 含有 边 的 数目 (。”)。 
A. nn B. n(n+1) C,H D. n(n-1) 
3. 具有 NN 个 顶点 、E 条 边 的 无 向 图 采用 邻接 矩阵 存储 ， 则 零 元 素 的 个 数 为 (。”)。 
A. 2E B.E C. N’2E D. NE 
4. 在 图 采用 邻接 表 存 储 时 ， 求 最 小 生成 树 的 普 里 姆 算法 的 时 间 复 杂 度 为 (。”)。 
A. Omn) B. O(nte) C. Om’) D. O(n’) 
5. 已 知 有 向 图 G=(VE), 其 中 V={ViyVaV3,VaVs,VeV7}, E={<Vi,V2>,<Vi,Va>,<ViVe>， 





<V2V5>,<ViV5>,<VaVe>,<V4V6>,<Vi,V7>,<V6eV7>}G 的 拓扑 序列 是 (。 )。 


Do 
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i 
A. Vi,V3,V4 Ve V2 Vs,V7 B. Vi,V3,V2,VG V4 Vs, V7 
C. Vi,V3,V4Vs,V2, VG V7 D. Vi,V2,Vs,V3,V4, V6 V7 
7.2 填空 题 


1. 具有 n 个 项 点 的 无 向 连通 图 G 中 至 少 有 条 边 。 
2. 如 果 含 n 个 顶点 的 图 G 形成 一 个 环 ， 则 G 有 _ _ 棵 生成 树 。 
3， 为 了 实现 图 的 广度 优先 搜索 遍历 ， 除 了 一 个 标志 数组 标志 已 访问 的 图 的 结 点 外 ， 
还 需 。 存放 被 访问 的 结 点 以 实现 遍历 。 
4. 普 里 姆 算法 适用 于 求 的 网 的 最 小 生成 树 ， 克 和 鲁 斯 卡尔 算法 适用 于 求 
的 网 的 最 小 生成 树 。 
5. 判断 一 个 有 向 图 是 否 存在 回路 除了 可 以 利用 拓扑 排序 方法 外 ， 还 可 以 用 
7.3 思考 题 
1. 图 的 逻辑 结构 特点 是 什么 ? 什么 是 无 向 图 和 有 向 图 ? , 什 旦 子 图 ? 什么 是 网 络 ? 
2. 什么 是 项 点 的 度 ? 什么 是 ee ? 什么 是 非 连 通 图 的 连 
通 分 量 ? 
3. 用 邻接 矩阵 表示 图 时 ， AS i ote 
相关 ? 
ee 有 n 个 顶点 的 有 向 强 连通 图 至 少 有 多 
少 条 边 ? 
5. 分 别 给 
点 访问 序列 。 













































































图 7.37 交通 图 G 
6. 写 出 图 7.38 所 示 有 向 图 的 拓扑 排序 序列 。 














7. 如 图 7.39 所 示 ， 试 给 出 无 向 图 G 对 应 的 邻接 矩阵 ， 并 写 出 广度 优先 搜索 人 遍历 算法 。 


Sono 
OQ—O 
9] DD QOD 
C—O 人 一 这 
图 7.38 有 向 图 G 图 7.39 无 向 图 G 
8. 已 知 图 7.40 所 示 的 有 向 图 ， 给 出 该 图 的 如 下 信息 : 
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(1) 每 个 项 点 的 入 度 、 出 度 ; 

(2) 邻接 矩阵 ， 

G) 邻接 表 ， 

(4) 道 邻接 表 ; 

(5) 强 连通 分 量 。 

9。 试 回答 下 列 关 于 图 的 一 些 问题 ， 

(1) 如果 GI 是 一 个 具有 个 顶点 的 连通 无 向 图 ,那么 G1 最 多 。 Ee 
有 多 少 条 边 ? G1 最 少 有 多 少 条 边 ? 0 

(2) 如 果 G2 是 一 个 具有 n 个 顶点 的 强 连通 有 向 图 ， 屠 么 G2 最 多 有 多 少 条 边 ? G2 最 
少 有 多 少 条 边 ? 

G) 如 果 G3 是 一 个 具有 n 个 顶点 的 弱 连 通 有 向 图 ， 那 么 G3 最 多 有 多 少 条 边 ? G3 最 
少 有 多 少 条 边 ? ， 
(对 于 一 个 有 向 图 ， 不 用 拓 失 排序 ， 如 何 多 断 图 中 是 容 和 在 环 ? 
10， 设 G-(VE) 以 邻接 表 存 储 ， 如 图 7.41 所 示 ， 试 画册 图 的 深度 优先 生成 树 和 广度 优 
先生 成 树 。 a 下 





















































) 
» 所 一 图 7.41 有 
DA | 之 
1. 设 无 向 图 G 有 n 个 顶点 、 m 条 这 斌 编写 用 入 接 表 存储 该 图 的 算法 ( 设 顶 点 值 
1~n 或 0~n- | 
2. 给 出 以 十 字 链 表 作为 存储 结构 ， 建 立 图 的 算法 ， 输 入 (ij,v)， 其 中 i、j 为 顶点 号 ， 
Vv 为 权 值 。 
13. 设 有 向 G 图 有 mn 个 点 (用 1,2,…,n 表示 )、e 条 边 , 写 一 算法 根据 其 邻接 表 生 成 其 反 
向 邻接 表 ， 要 求 算法 复杂 性 为 O(n+e)。 
4. 假设 有 向 图 以 邻接 表 存 储 ， 试 编写 算法 删除 弧 <Vi. VP> 的 算法 。 
15. 设 无 向 图 G 已 用 邻接 表 结 构 存储 ， 顶 点 表 为 GL[n] Cn 为 图 中 顶点 数 )， 试 用 广度 
优先 搜索 遍历 方法 ， 写 出 求 图 G 中 各 连通 分 量 的 C 语言 描述 算法 : BFSCOM(GL)。( 注 : 
算法 中 可 调用 队列 操作 的 基本 算法 。) 
6. 写 出 图 的 深度 优先 搜索 遍历 算法 的 非 递归 算法 。 
17. 令 G=(V，E) 为 一 个 有 向 无 环 图 ， 编 写 一 个 给 图 G 中 每 一 个 顶点 赋 以 一 个 整数 序 
号 的 算法 ， 并 满足 以 下 条 件 ， 若 从 顶点 i 至 项 点] 有 一 条 弧 ， 则 应 使 <j。 
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排 序 


学 悦目 标 


(1) 理解 排序 的 定义 和 各 种 排序 方法 的 特点 ， 并 能 加 以 灵活 应 用 。 

(2) 掌握 各 种 排序 方法 的 时 间 复杂 度 及 分 析 方法 。 

(3) 理解 排序 方法 “稳定 ”或 “不 稳定 ” 的 含义 及 应 用 场合 。 
知识 千 稳 图 N 厂 

折 烛 插入 排序 
-人 快速 拓 序 


: 1 | 直接 选 振 排 序 
选择 排序 
归并 排序 
二 关键 字 排 序 
多 关键 字 排 序 
| 链 式 基数 排序 
= | 荷兰 国旅 问题 
| 
[双向 冒 泡 问题 





















希 尔 排序 、 快 速 排 序 、 堆 排序 和 归并 排序 等 高 效 方法 是 本 章 的 学 习 重 点 和 难点 。 


Et 

本 章 学 习 的 要 点 主要 是 了 解 各 种 排序 方法 实现 时 所 依据 的 原则 及 它们 的 主要 操作 (“关键 字 
间 的 比较 ”和 “记录 的 移动 ”) 的 时 间 分 析 。 学 习 中 应 注意 掌握 各 种 排序 方法 实现 的 要 点 ， 切 实 
掌握 各 种 排序 过 程 的 排序 特点 所 在 。 


© 一 ee 


8.1 基本 概念 


关键 字 (key words) 是 数据 元 素 中 的 某 个 数据 项 。 如 果 某 个 数据 项 可 以 唯一 地 确定 一 个 
数据 元 素 ， 就 将 其 称 为 主 关键 字 ， 否 则 ， 称 为 次 关键 字 。 

排序 (sorting) 即 把 一 组 记录 或 数据 元 素 的 无 序 序列 按照 某 个 关键 字 值 (关键 字 ) 递 增 或 
递减 的 次 序 重 新 排列 的 过 程 。 

假设 含有 n 个 记录 的 序列 为 {Ri1, Ra,…, Rn}， 其 相应 的 关键 字 序 列 为 {Ki1, K2,…, Ka}。 
需 确定 1, 2,…, n 的 一 种 排序 pi, p2,…, ps， 使 其 相应 的 关键 字 满 足 如 下 关系 : 





Kn < Ky < SK (8.1) 
即使 得 {R1, Ra…, Rw} 的 序列 成 为 一 个 按 关 键 字 有 序 的 序列 : <R 
{ Rov Rp Ra } 、 (8.2) 


这 个 将 原 有 表 中 任意 顺序 的 记录 变 成 一 个 按 关 键 字 有 ee 

待 排序 记录 序列 可 以 用 顺序 存储 结构 或 链 式 存储 绪 构 表示 。 在 本 章 的 讨论 中 ( 除 基数 排 
序 外 )， 若 无 特别 说 明 ， 均 假定 待 排序 的 记录 i 结构 来 存储 ， 即 用 一 维 数组 
实现 ， 并 假定 按 关键 字 非 递减 方式 排序 ,为 简单 起 见 ， 假 设 关键 字 类 型 为 整 型 。 此 结构 也 
将 用 于 之 后 我 们 要 讲 的 所 有 排序 算法 必 SEXT 


#define MAXSIZE 10000 排序 数组 个 数 最 大 
typedef int We ee 

















人 struct 
int rl[ ZE#t1]; ”// 用 于 存 和 上 [0] 用 作 哨 兵 或 临时 变量 


int RY /7 用 于 的 长 度 
i 
于 


另外 ， 由 于 pe 我 们 将 它 写 成 函数 ， 在 之 后 的 讲 
解 中 会 大 量 地 使 用 。 
void swap(SqList *L,int i,int j) 
int temp=L->r[i]; 
L->r [i]=L->r[j]; 
L->r[j]=temp; 
} 
排序 又 称 分 类 ， 是 数据 处 理 领 域 中 一 种 很 常用 的 运算 ， 主 要 目的 是 实现 快速 查找 。 基 
本 的 排序 方法 主要 有 5 种 : 插入 排序 、 交 换 排 序 、 选 择 排序 、 归 并 排序 、 基 数 排序 。 
排序 算法 的 稳定 性 是 指 如 果 在 待 排序 的 记录 序列 中 有 多 个 数据 元 素 的 关键 字 值 相同 ， 
经 过 排序 后 ， 这 些 数 据 元 素 的 相对 次 序 保持 不 变 ， 则 称 这 种 排序 算法 是 稳定 的 ， 否 则 称 之 
为 不 稳定 的 。 
根据 在 排序 过 程 中 待 排序 的 所 有 数据 元 素 是 否 全 部 被 放置 在 内 存 中 ， 可 将 排序 方法 分 
为 内 部 排序 和 外 部 排序 两 大 类 。 内 部 排序 是 指 在 排序 的 整个 过 程 中 ， 待 排序 的 所 有 数据 元 


$f 
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素 全 部 被 放置 在 内 存 中 ， 外 部 排序 是 指 由 于 待 排序 的 数据 元 素 个 数 太 多 ， 不 能 同时 放置 在 
内 存 ， 而 需要 将 一 部 分 数据 元 素 放置 在 内 存 ， 另 一 ee 
过 程 需要 在 内 外 存 之 间 多 次 交换 数据 才能 得 到 排序 的 结果 。 本 章 只 讨论 的 内 部 排序 
方法 。 

在 排序 过 程 中 ， 基 本 动作 执行 一 次 ， 我 们 称 一 趟 。 评 价 排序 算法 的 效率 同样 要 考虑 时 
间 复 杂 度 和 空间 复杂 度 ， 即 在 数据 量规 模 一 定 的 条 件 下 ， 算 法 执行 所 消耗 的 平均 时 间 和 执 
行 算法 所 需要 的 辅助 存储 空间 。 对 于 排序 操作 ， 时 间 主 要 消耗 在 关键 字 之 间 的 比较 和 数据 
元 素 的 移动 上 ， 因 此 ， 我 们 可 以 认为 高 效率 的 排序 算法 应 该 是 尽 可 能 少 的 比较 次 数 和 尽 可 
能 少 的 数据 元 素 移动 次 数 。 辅 助 存 储 空间 是 指 在 数据 量规 模 一 定 的 条 件 下 ， 除 了 存放 待 排 
序数 据 元 素 占用 的 存储 空间 之 外 ， 执 行 算法 所 需要 的 其 他 存储 空间 。 理 想 的 空间 效率 是 算 
法 执行 期 间 所 需要 的 辅助 空间 与 待 排序 的 数据 量 无 关 。 


8.2 插入 排序 
































8.2.1 直接 插入 排序 KY 


国 点 此 回 直接 插入 排序 (Straight ao 的 排序 方法 。 它 的 基本 操 
作 是 依次 将 一 个 记录 插入 到 已 拓 序 的 有 序 表 中 ， 从 而 得 到 一 个 新 的 、 记 录 数 增 
首 1 的 有 序 表 。 其 具体 的 排序 过 程 可 以 描述 如 下 ;首先 将 待 排序 记录 序列 中 的 第 一 
[多 办 甸 广 个 记录 作为 一 个 有 序 宕 ， 将 记录 序列 中 的 第 二 不 记录 插入 到 上 述 有 序 表 中 形成 
两 个 记录 组 成 的 有 序 ohm 4 插入 到 这 个 有 序 段 中 ， 形 成 由 三 个 
记录 组 成 的 有 序 表 …”" 芒 此 类 推 ， 每 一 趟 都 是 录 插 入 到 前 面 的 有 序 表 中 ， 假 设 当 
pe . 则 应 该 将 这 个 记录 插入 到 he en 
成 一个 由 个 记 杀 组 成 的 技 关 键 字 人 排列 的 及 序列 ， 直 到 所 有 记录 者 插 入 到 有 记 表 中 ， 
一 上 需要 经 过 合十 就 可 以 将 初始 序列 的 个 记录 重新 排列 成 按 关键 字 值 大 小 排列 的 有 译 
序列 。 


























例如 ， 已 知 待 排序 的 一 组 记录 的 初始 序列 如 下 所 示 ; 
{23, 4, 15, 8, 19, 24, 15} (8.3) 
假设 在 排序 过 程 中 ， 前 4 个 记录 已 按 关键 字 递 增 的 次 序 重新 排列 ， 构 成 一 个 含 4 个 记 
录 的 有 序 序列 ， 
{4, 8, 15, 23} (8.4) 
现 要 将 原 序列 中 的 第 5 个 ( 即 关 键 字 19) 记 录 插 入 上 述 序 列 ， 以 得 到 一 个 新 的 含 5 个 记 
录 的 有 序 序列 , 则 首先 要 在 式 (8.4) 的 序列 中 查找 以 确定 19 所 应 插入 的 位 置 , 然后 进行 插入 。 
假设 从 23 起 向 左 进行 顺序 查找 ， 由 于 15S<19<23， 则 19 应 插入 在 15 和 23 之 间 ， 从 而 得 到 
下 列 新 的 有 序 序列 : 





{4, 8, 15, 19, 23} (8.5) 
称 从 序列 (8.4) 到 序列 (8.5) 的 过 程 为 一 趟 直接 插入 排序 。 整 个 直接 插入 排序 的 过 程 如 图 8.1 
所 示 。 对 应 的 直接 插入 排序 代码 见 算法 8.1。 


@r 


























初始 关键 他 : [23] 4 15 8 19 24 入 
第 一 趟 排序 结果 [4 23] ”多 19 24 他 
第 一 趟 排序 结 [4 15 23] 8 19 24 15 
第 三 趟 排序 结果 : [4 15 23] 19 24 15 
第 四 趋 排 序 结 果 : [4 8 15 1 2] 24 五 
第 五 趟 排序 结果 : [4 8 15 19 23 , 5 
第 六 趟 排序 结果 : [4 8 15 15 AN 23 24] 


算法 8.1 直接 插入 排序 SA、 

void InsertSort(SqList *L) ™ WY 

{ 人 
和 


i vo 

~ 从 

if ee Wa 

{ 

A 人 // 设 置 哨兵 
(=i-1;L->r[j]>: JR 

NS L->r[j+1]=L->r[ 

L->r[j+1]=L->r[0]; 


四 


} 


通过 以 上 代码 我 们 发 现 ， 直 接 插 入 排序 算法 简单 ， 且 容易 实现 ， 只 需要 一 个 记录 大 小 的 
辅助 空间 用 于 存放 待 插入 的 记录 (在 C 语言 中 ， 我 们 利用 了 数组 中 的 0 单元 ) 和 两 个 整 型 变量 。 
当 待 排序 记录 较 少 时 ， 排 序 速度 较 快 。 但 是 ， 当 待 排序 的 记录 数量 较 大 时 ， 大 量 的 比较 和 移动 
操作 将 使 直接 插入 排序 算法 的 效率 降低 ; 然而 ， 当 待 排序 的 数据 元 素 基 本 有 序 时 ,直接 插入 排 
序 过 程 中 的 移动 次 数 大 大 减少 ， 从 而 效率 会 有 所 提高 。 插 入 排序 是 一 种 稳定 的 排序 方法 。 

从 上 述 排序 过 程 可 见 ， 排 序 中 的 两 个 基本 操作 是 (关键 字 间 的 ) 比 较 和 (记录 的 ) 移 动 。 
因此 排序 的 时 间 性 能 取决 于 排序 过 程 中 这 两 个 操作 的 次 数 。 从 直接 插入 排序 的 算法 可 见 ， 
这 两 个 操作 的 次 数 取决 于 待 排 记录 序列 的 状态 ， 当 待 排 记录 处 于 “ 正 序 ”( 即 记录 按 关 键 字 
从 小 到 大 的 顺序 排列 ) 的 情况 时 ， 所 需 进行 的 关键 字 比 较 和 记录 移动 的 次 数 最 少 。 反 之 ， 当 
待 排 记录 处 于 “逆序 ”( 即 记录 按 关键 字 从 大 到 小 的 顺序 排列 ) 的 情况 时 ， 所 需 进 行 的 关键 


字 比 较 和 记录 移动 的 次 数 最 多 ， 见 表 8-1。 
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表 8-1 直接 插入 排序 的 复杂 度 分 析 
待 排 记录 序列 状态 “比较 ”次数 “移动 "次 数 
正 序 n-l 0 
逆序 (n+2)(n+1)/2 (n+4)(n-1)/2 


待 排 记 录 序 列 处 于 随机 状态 ， 则 可 以 最 坏 情 况 和 最 好 情况 的 平均 值 作为 插入 排序 的 时 
间 性 能 的 量度 。 一 般 情况 下 ， 直 接 插入 排序 的 时 间 复 杂 度 为 O(n”)。 
8.2.2” 折 半 插 入 排序 

直接 插入 排序 算法 简便 ， 且 容易 实现 。 当 待 排序 记录 的 数量 n 很 小 时 ， 这 是 一 种 很 好 
的 排序 方法 。 但 是 ， 通 常 待 排序 序列 中 的 记录 数量 n 很 大 ， 则 不 宜 采 用 直接 插入 排序 。 由 
此 需要 讨论 改进 的 办 法 。 

在 直接 插入 排序 的 基础 上 ， 从 减少 “比较 ”和 “移动 ”这 两 种 操作 的 次 数 着 手 ， 我 们 
接 下 来 讨论 一 种 改进 的 方法 ， 即 折 半 插入 排序 。 

由 于 折 半 插入 排序 的 基本 操作 是 在 一 个 有 序 表 中 进行 查找 和 插入 ， 且 这 个 “查找 ”操作 
是 利用 “ 折 半 查找 ”来 实现 ， 由 此 进行 的 插入 排序 称 为 折 半 插入 排序 (Binary Insertion Sort)。 

相应 的 代码 见 算法 8.2， 在 rflow...high] 中 折 半 查找 有 序 插入 的 位 置 

算法 8.2 ” 折 半 插入 排序 


void BInsertSort (SqList AN 














int low,high; 


int my pA 2 
for(int 1 Pe onsetitt)) XX 人 
{ 2 和 SS 六 
A 不 以 过 
f 


A 
A e(low<=high) 
m=(low+high)/2; 


if(L.r[0]<L.r[m])high=m-1; // 插 入 低 半 
else low=m+1; // 插 入 高 半 


办 又 





} 
for ( int j=i-1;j>=low;--j)L.r[j+1]=L.r[j]; 
L.r[high+1]=L.r[0]; 


} 


通过 以 上 代码 我 们 发 现 ， 确 定 插入 位 置 所 进行 的 折 半 查找 ， 定 位 一 个 关键 字 的 位 置 需 
要 比较 次 数 至 多 为 [logxn+1)] 次 ， 所 以 比较 次 数 时 间 复 杂 度 为 O(nlog2n)， 而 移动 记录 的 
次 数 和 直接 插入 排序 相同 ， 因 此 ， 时 间 复 杂 度 仍 为 O(n”)。 


8.2.3 ” 希 尔 排 序 





希 尔 排序 (Shell Sort) 又 称 为 “缩小 增 量 排序 ”(Diminishing Increment Sort), 是 D.L.Shell 
于 1959 年 提出 来 的 一 种 排序 算法 。 其 基本 思想 是 将 待 排序 的 记录 划分 成 几 组 ,从 而 减少 参 
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与 直接 插入 排序 的 数据 量 ， 当 经 过 几 次 分 组 排序 后 ， 记 录 的 排列 已 经 基本 有 序 ， 这 个 时 候 
再 对 所 有 的 记录 实施 直接 插入 排序 。 

具体 步骤 可 以 描述 如 下 : 假设 待 排序 的 记录 为 n 个 , 先 取 整数 d<n。 例如 , 取 d= n/2 (n/2 
表示 不 大 于 n/2 的 最 大 整数 )， 将 所 有 距离 为 d 的 记录 构成 一 组 ， 从 而 将 整个 待 排序 记录 序 
列 分 割 成 为 d 个 子 序列 ， 如 图 8.2 所 示 。 对 每 个 分 组 分 别 进行 直接 插入 排序 ， 然 后 缩小 间 
隔 4d。 例 如 ， 取 d= d/2 ， 重复 上 述 的 分 组 ， 青 对 每 个 分 组 分 别 进行 直接 插入 排序 ， 使 整个 
排序 序列 基本 有 序 ， 所 谓 的 基本 有 序 ， 就 是 小 的 关键 字 基 本 在 前 面 ， 大 的 基本 在 后 面 ， 不 
大 不 小 的 基本 在 中 间 。 直 到 最 后 取 d=1， 即 将 所 有 记录 放 在 一 组 进行 一 次 直接 插入 排序 ， 
最 终 将 所 有 记录 重新 排列 成 按 关 键 字 有 序 的 序列 。 



































假设 待 排序 表 关 键 字 序列 为 58,46,72,95,84,25,37,58,63,12， 步 长 因子 分 别 取 5,3,1， 则 
排序 过 程 ， 如 图 8.2 所 示 。 
初始 关键 学 58 46 72 95 84 27- es 63 12 








第 一 趋 排序 结果 25 37 于 .63 
| NS 


第 二 趋 排 序 结 果 25 12 可 37 58 63 72 95 84 
l | | | | 




















AN 
第 三 超 排 序 结果 7 6 95 


”图 8.2 mp 
党 以 二 
对 于 希 尔 排 aa 哨 两 种 情况 来 阐述。 有 具体 描述 如 下 : 
1. 不 设 监视 哺 的 算法 描述 > 


其 相应 失信 码 见 算法 83， 将 R[d+1.… aa 而 R[0] 只 是 暂 存 
单元 ， 不 是 哨兵 。 
算法 8.3 不 设 监视 哨 的 希 尔 排序 
void ShellPass(SqList *L,int qd) 
{ // 希 尔 排序 中 的 一 趋 排 序 ，a 为 当前 增 量 
1 
for(int i=d+1;i<=L->length;i++) 
if(L->r [i]<L->r[i-d]){ 
L->r [0]=L->r[i]; 





=i 

do 1{ // 查 找 R[i] 的 插入 位 置 
L->r[j+d]=L->r[j]; 
j=j-a; // 查 找 前 一 记录 


}while(j>0g&&L->r [0]<L->r[j]); 
L->r[j+d]=L->r[0]; 
}//endif 
}//ShellPass 
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< 
当 增 量 d=1 时 ，ShellPass 和 InsertSort 基本 一 致 ， 只 是 由 于 没有 哨兵 而 在 内 循环 中 





增加 了 一 个 循环 判定 条 件 “j>0”， 以 防 下 标 越 界 。 


2， 设 监视 哨 的 算法 描述 < 
算法 8.4 设 监视 哨 的 希 尔 排序 





如 由 





(1) 实际 上 ,一切 为 简化 边界 条 件 而 引入 的 附加 结 点 (元 素 ) 均 可 称 为 哨兵 。 例如， 单 
链表 中 的 头 结 点 实际 上 是 一 个 哨兵. 

(2) 引入 哨兵 后 使 得 测试 查找 循环 条 件 的 时 间 约 减少 了 一 半 ， 所 以 对 于 记录 数 较 大 
的 文件 ， 节 约 的 时 间 就 相当 可 观 。 对 于 类 似 于 排序 这 样 使 用 频率 非常 高 的 算法 ， 要 尽 可 


能 地 减少 其 运行 时 间 。 所 以 不 能 把 上 述 算法 中 的 哨兵 视 为 雕 虫 小 技 ， 而 应 该 深刻 理解 并 
掌握 这 种 技巧 。 
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和 希 尔 排序 适用 于 待 排序 的 记录 数目 较 大 时 ， 在 此 情况 下 ， 希 尔 排序 方法 一 般 要 比 直接 
插入 排序 方法 快 。 希 尔 排序 的 分 析 是 一 个 很 复杂 的 问题 ， 因 为 它 的 时 间 是 所 取 “ 增 量 ” 序 
列 的 函数 ， 这 涉及 一 些 数学 上 尚未 解决 的 难题 。 因 此 ， 到 目前 为 止 尚 未 有 人 求 得 一 种 最 好 
的 增 量 序列 ， 但 大 量 的 研究 已 得 出 一 些 局 部 的 结论 。 希 尔 排序 的 时 间 复 杂 度 和 所 取 增 量 序 
列 相关 ， 例 如 ， 已 有 学 者 证 明 ， 当 增 量 序列 为 2 (ce=0.1, …, t-1) 时 ， 希 尔 排 序 的 时 间 复 
杂 度 为 O(n””)。 增 量 序列 可 以 有 各 种 取 法 ， 但 需 注意 ， 应 使 增 量 序列 中 的 值 没 有 除 1 之 外 
的 公 因子 ， 并 且 最 后 一 个 增 量 值 必须 等 于 1。 


8.3 交换 排序 


交换 排序 的 基本 思想 是 两 两 比较 待 排序 记录 的 关键 字 ， 发 现 两 个 记录 的 次 序 相 反 时 即 
进行 交换 ， 直 到 没有 反 序 的 记录 为 止 。 应 用 交换 排序 基本 思想 的 主要 排序 方法 有 冒 泡 排序 
和 快速 排序 。 CN 回 和 并 加 
8.3.1 冒 泡 排 序 去 


冒 泡 排序 (bubble sorb 是 一 种 交换 排序 ， 它 的 基本 思想 是 两 两 比较 相 邻 记录 【参考 图 文 】 
的 关键 字 ， 如 果 反 序 则 交换 ， 直 到 没有 反 序 的 记录 为 止 。 冒 泡 的 实现 在 细节 上 可 以 有 很 多 
种 变化 ， 我 们 将 分 别 就 3 种 不 同 的 冒 泡 排序 实现 代码 来 讲解 冒 泡 排序 的 思想 。 这 里 ， 我 们 
先 来 看 看 比较 容易 理解 的 一 段 代码 ,>* 详 见 算 法 8.5。 

算法 8.5 最 简单 的 交换 排序 

void BubbleSortAa qrist ,KT 

{ NS 

int i je E> 


for nn ty 大 公 2 





















































for(j=i+1;j<=L->length;j++) 
{ 
if(L->r[i]>L->r[j]) 
swap(L,i,j); // 交 换 i 与 j 的 值 


} 


} 
这 段 代 码 严 格 意义 上 说 不 算是 标准 的 冒 泡 排序 算法 ， 因 为 它 不 满足 “两 两 比较 相 邻 记 
录 ” 的 冒 泡 排序 思想 ， 它 应 该 是 最 简单 的 交换 排序 而 已 。 它 的 思路 就 是 让 每 一 个 关键 字 都 
和 它 后 面 的 每 一 个 关键 字 比较 ， 如 果 大 则 交换 ， 这 样 第 一 位 置 的 关键 字 在 一 次 循环 后 一 定 
变 成 最 小 值 。 如 图 8.3 所 示 ， 假 设 我 们 待 排序 的 关键 字 序列 是 {11,3,7,10,5,9,6,8,4}， 当 二 1 
时 ， 如 图 8.3(a) 所 示 ，11 与 3 交换 后 ， 在 第 一 位 置 的 3 与 后 面 的 关键 字 比 较 都 小 。 因 此 3 
是 最 小 值 ， 放 置 首位 。 当 i=2 时 ， 如 图 8.3(b) 所 示 ， 第 二 位 置 先后 由 11 换 成 7， 换 成 5， 换 


成 4， 最 终 将 4 放置 在 第 一 位置。 后面 的 数字 变换 类 似 ， 不 再 介绍 。 
0 2 
UL 
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图 8.3 冒 泡 排序 
观察 后 发 现 这 种 排序 是 有 缺陷 的 ， 在 排 好 1 和 2 的 位 置 后 ， 对 其 余 关键 字 的 排序 没有 
什么 帮助 (数字 5 反而 还 被 换 到 了 最 后 一 位 )。 也 就 是 说 ， 这 个 算法 的 效率 是 非常 低 的 。 
下 面 是 经 典 的 冒 泡 算法 ， 其 中 j 是 从 后 往 前 循环 。 人 险 
算法 8.6 ” 冒 泡 排序 A 


void BubbleSortB(SqList *L) ES 














int ij 


for(i=1;i<L->length;i++) > 
; for(j=L->length-1; 
te j+1]) de 
村 Nm NS 
fF 密 


依然 假设 我 们 竺 排序 的 关键 字 序 列 是 {11,3,7,10,5,9,6,8,4}， 当 二 1 时 , 变量 j 由 8 反 
向 循环 到 1， 逐 个 比较 ， 将 较 小 值 交换 到 前 面 ， 直 到 最 后 找到 最 小 值 放置 在 第 一 位 置 。 如 
图 8.4 所 示 ， 当 二 1、j=8 时 ， 我 们 发 现 8>4， 因 此 交换 了 它们 的 位 置 ，j=7 时 ，6>4， 所 以 
交换 …… 直 到 j=2 时 ,因为 3<4， 所 以 不 再 交换 。j=1 时 ，11>3， 交 换 ， 最 终 得 到 最 小 值 3， 
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图 8.4 当 i=1 时 的 排序 过 程 


@s 


Ly 排序 
6 i 


并 放置 在 第 一 位 置 。 事 实 上 ， 在 不 断 循环 的 过 程 中 ， 除 了 将 关键 字 3 放 到 第 一 位 置 外 ， 我 
们 还 将 关键 字 4 从 第 九 位 置 提 到 第 三 位 置 ， 显 然 这 一 算法 比 前 面 的 算法 有 进步 ， 在 上 万 条 
数据 的 排序 过 程 中 , 这 种 差异 会 体现 出 来 。 图 8.4 中 较 小 的 数字 如 同 气泡 般 慢 慢 浮 到 上 面 
因此 ， 将 此 算法 命名 为 冒 泡 算法 。 

当 2 时 , 变量 j 由 8 反 向 循环 到 2, 逐个 比较 , 在 将 关键 字 4 交换 到 第 二 位 置 的 同时 ， 
也 将 关键 字 6 和 5 有 所 提升 ， 如 图 8.5 所 示 。 
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8.5 当 i=2 时 的 
NS 


后 面 的 数字 变换 很 简单 ， 这 时 不 和、 
这 样 的 时 泡 程序 是 否 还 可 以 优化 呢 ? 答案 :肯定 的 。 试 想 一 下 ， 如 果 我 们 待 排序 的 序 
列 是 {4,3,5,6,7,8,9,10,11}， 也 就 是 说 、 除 第 一 位 置 和 第 二 位 置 的 关键 字 需 要 交换 外 ， 别 的 
位 着 的 关键 字 都 已 经 是 正常 的 顺序 %3 这 1 时 , 交换 4 和 弛 此 时 序列 已 经 有 序 , 如 图 8.6(a) 
所 示 , 但 是 算法 仍然 将 2 一 9 每 个 循环 中 的 j4 环 都 执行 了 一 遍 ， 尽管 并 没有 交换 数据 ， 
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图 8.6 经 典 冒 泡 排 序 存在 的 问题 


当 i=2 时 ， 我 们 已 经 对 11 与 10，10 与 9，…，5 与 4 作 了 比较 ， 没 有 任何 数据 交换 ， 
这 就 说 明 此 序列 已 经 有 序 ， 不 需要 再 继续 后 面 的 循环 判断 工作 了 。 为 此 ， 我 们 对 代码 进行 
改进 ， 增 加 一 个 标记 变量 flag 来 实现 这 一 算法 的 改进 。 首 先 将 flag 赋 初 值 为 FALSE， 在 执 
行 过 程 中 ， 若 flag 为 TRUE 说 明 有 过 数据 交换 ， 和 否则 停止 循环 。 

算法 8.7 优化 后 的 冒 泡 排序 

void BubbleSortC(SqList *L) 

{ 


局 
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er. 
nb pn 
int flag=TRUE; 
for(i=1;i<L->length && flag;i++) 
{ 
flag=FALSE; 
for(j=L->length-1;j>=i;j--) 
{ 
if(L->r[j]>L->r[j+1]) 
{ 
swap(L, j,j+1); // 交 换 j 与 j+1 的 值 
flag=TRUE; // 有 数据 交换 ， 循 环 继续 


| 论 
} ” 
bp 

代码 改动 的 关键 就 是 在 i 变量 的 for 循环 中 ， 增 加 了 对 “hag 是否 为 TRUE 的 判断 。 经 
OT 免 已 经 有 序 的 情况 下 的 无 意义 
循环 判断 。 SS 

冒 泡 排 序 比较 简单 ， 当 初始 序列 基本 有 应 站 ， 导 泡 排序 有 较 高 的 效率 ， 反 之 效率 较 低 
其 次 时 泡 排序 只 需要 一 个 记录 的 征 助 室 间 》 用 类 作为 记录 交换 的 中 辐 御 存 单元 ， 导 振 
是 一 种 稳定 的 排序 方法 。 

冒 泡 排序 时 间 复杂 度 的 分 析 : mr, nailer wa 
We 在 最 


AR 0 


交 ， 并 作 竺 的 记 到 i 
8.3.2 ”快速 排序 


快速 排序 (Quick Sort) 是 对 冒 泡 排序 的 一 种 改进 。 其 基本 思想 是 ， 通 过 一 趟 排序 将 待 排 
记录 分 割 成 独立 的 两 部 分 ， 其 中 一 部 分 记录 的 关键 字 均 比 男 一 部 分 记录 的 关键 字 小 ， 则 可 
分 别 对 这 两 部 分 记录 继续 进行 排序 ， 以 实现 整个 序列 有 序 。 

一 趟 快速 排序 的 具体 做 法 是 附设 两 个 指针 low 和 high， 它 们 的 初 值 分 别 为 low 和 
high， 设 枢 轴 记 录 的 关键 字 为 pivotkey， 则 首先 从 high 所 指 位 置 起 向 前 搜索 找到 第 一 
关键 字 小 于 pivotkey 的 记录 ， 和 枢 轴 记录 互相 交换 ， 然 后 从 low 所 指 位 置 起 向 后 搜索 ， 
找到 第 一 个 关键 字 大 于 pivotkey 的 记录 ， 和 枢 轴 记录 互相 互 换 ， 重 复 这 两 步 直 至 
low=high 为 止 。 

对 关键 字 值 为 45，33，68，95，78，13，26，45) 的 记录 序列 进行 一 趟 快速 排序 的 过 
程 如 图 8.7 所 示 。 

- 趟 快速 排序 之 后 ， 再 分 别 对 左 、 右 两 个 区 域 进行 快速 排序 ， 以 此 类 推 ， 直 到 每 个 分 
区 域 都 只 有 一 个 记录 为 止 。 其 具体 实现 见 算法 8.8， 其 中 用 子 表 的 第 一 个 记录 作为 枢 轴 记 
录 ， 从 表 的 两 端 交替 地 向 中 间 扫 描 。 


@y 








(i-D)=1+2+3+:…+(n—1) 
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初始 关键 学 序列 4 33 68 95 7 13|2|4 
high 向 前 搜索 low ne 


第 一 次 交换 后 26 33, 68 95 78 13 45 
| high 
low 向 后 搜索 26 33 68 站 78 13 45 
oof high 
第 一 次 交换 后 26 3 六 3 95 78 13 68 45 
low f 


第 三 次 交换 后 26 3 1 95 68 45 


/ 
第 川 次 交换 后 26 33 1 78 ,95 68 4 
Go wa 
j 向 前 二 | 描 2 13 


完成 一 赵 排 ; ) {26 33 DNSA {78 95 68 43 

是 次 快速 排 1 i {13} “和 下 45 {145 68} 78 {95} 

入 结束 45 {68 结束 

有 序 序 刻 {3 26 33 45 45 68 78 95 
图 8.7 快速 排序 过 程 示意 图 





8 95 68 4 


算法 8.8 快速 排序 
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对 于 算法 8.8， 每 交换 一 对 记录 需 进行 3 次 记录 移动 (赋值 )。 而 实际 上 ， 在 排序 过 程 中 
对 枢 轴 记 录 的 赋值 是 多 余 的 ， 因 为 只 有 在 一 趟 排序 结束 时 ， 即 low=high 的 位 置 才 是 枢 轴 记 
录 的 最 后 位 置 。 由 此 可 改写 上 述 算 法 ， 先 将 枢 轴 记录 和 暂 存 在 r[0] 的 位 置 上 ， 排 序 过 程 中 内 
作 rflow] 或 r[higb] 的 单 向 移动 ， 直 至 一 趟 排序 结束 后 再 将 枢 轴 记 录 移 至 正确 位 置 上 。 其 具 
体 实现 见 算法 8.9， 首 先 计算 数组 中 间 的 元 素 的 下 标 ， 交 换 左 端 数据 与 右 端 数据 ， 保 证 左 
端 数据 较 小 ;交换 中 间 数 据 与 右 端 数据 ， 保 证 中 间 数 据 较 小 ;交换 中 间 数 据 与 左 端 数据 ， 
保证 左 端 数据 较 小 。 用 子 表 的 第 一 个 记录 作为 枢 轴 记 录 ， 将 枢 轴 关 键 字 备份 到 L->r[0]， 
从 表 的 两 端 交替 地 向 中 间 扫 描 。 人 

算法 8.9 快速 排序 优化 算法 /XK 








整个 快速 排序 的 过 程 可 递归 进行 。 若 待 排序 列 中 只 有 一 个 记录 ， 显 然 已 经 有 序 ， 否 则 
进行 一 趟 快速 排序 后 再 分 别 对 分 割 所 得 的 两 个 子 序列 进行 快速 排序 。 递 归 形 式 的 快速 排序 
见 算法 8.10， 首 先 将 L->r[low...high] 一 分 为 二 ， 算 出 枢 轴 值 pivot， 然 后 分 别 对 低 子 表 、 
高 子 表 进 行 递归 排序 。 


er 


O AN 


算法 8.10 ”快速 排序 的 递归 表示 


void QSort(SqList *L,int low,int high) 
{ 
int pivot; 
if(low<high) 
pivot=Partition(L, low, high); 
QSort(L, low, pivot-1); 
QSort(L, pivot+1, high); 





} 


void QuickSort(SqList *L) 论 
{ NN 


QSort(L,1,L->length); & 
} 


总 的 来 说 ， 快速 排序 实质 上 是 对 冒 泡 排序 的 二 a 它 的 效率 与 冒 泡 排 序 相 比 有 很 
大 提高 。 冒 泡 排序 是 对 相 邻 两 个 记录 进行 关键 字 比 较 和 互 换 的 ， 这 样 每 次 交换 记录 后 ， 只 
能 改变 一 对 逆序 记录 ， 0 录 的 两 端 开始 进行 比较 和 交换 ， 并 逐渐 向 
中 间 靠 拢 ， 每 经 过 一 次 交换 ， 有 可 能 改变 对 道 序 记 录 ， 从 而 加 快 了 排序 速度 。 到 目前 为 
止 ， 快速 排序 是 平均 速度 最 快 的 一 种 排序 方法 ， 但 当 原 始 记录 排列 基本 有 序 或 基本 逆序 时 ， 
每 _ 粘 的 基准 记录 有 可 能 只 昔 东 余 记录 分 成 “部 分 :区 和 低 了 时 间 效 率 。 所 以 快速 排 
序 适用 于 原始 记录 排列 杂乱 无 章 的 情况 。 快速 排序 是 :种 不 稳定 的 排序 ， 在 递归 调用 时 需 
要 占据 一 定 的 存储 空间 ， | 以 保存 每 一 民间 归 调 用 时 的 必要 信息 。 

六 YA a 
NA 84 选择 排序 

选择 排序 (Selection Sort) 的 基本 思想 是 每 一 趟 在 n-i+1(i=1，2,…, n-1) 个 记录 中 选择 关 
键 字 最 小 的 记录 作为 有 序 序列 中 的 第 i 个 记录 。 其 中 最 简单 且 为 读者 最 熟悉 的 是 简单 选择 
排序 。 常 用 的 选择 排序 方法 有 直接 选择 排序 和 堆 排 序 。 
8.4.1 直接 选择 排序 


一 趟 简单 排序 的 操作 为 通过 n-1 次 关键 字 的 比较 ， 从 nri+1l 个 记录 中 选取 关键 字 最 小 
的 记录 作为 有 序 序列 中 的 第 i 个 记录 ， 并 和 第 i(1<i<n) 个 记录 交换 。 
一 个 有 n 个 记录 的 待 排 序列 ， 可 经 过 n-1 趟 直接 选择 排序 得 到 有 序 结果 。 





















































1. 初始 状态 
设 无 序 区 为 R[1..n]， 有 序 区 为 空 。 
2. 第 1 趟 排序 





在 无 序 区 R[1...n] 中 选 出 关键 字 最 小 的 记录 R[k]， 将 它 与 无 序 区 的 第 1 个 记录 R[1] 交 


只 
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换 ， 使 R[1] 和 R[2...n] 分 别 变 为 记录 个 数 增加 1 个 的 新 有 序 区 和 记录 个 数 减 少 1 个 的 新 无 
序 区 。 
3， 第 i 趟 排序 


第 i 趟 排序 开始 时 ， 当 前 有 序 区 和 无 序 区 分 别 为 RE1.…ir-H 和 R[i.n](G si 和 nr-1)。 该 趟 
排序 从 当前 无 序 区 中 选 出 关键 字 最 小 的 记录 R[k]， 将 它 与 无 序 区 的 第 1 个 记录 Ri 交换 ， 使 
RI1. 避 和 R[it1...n] 分 别 变 为 记录 个 数 增加 1 个 的 新 有 序 区 和 记录 个 数 减少 1 个 的 新 无 序 区 。 

这 样 ，n 个 记录 的 文件 可 经 过 n-1 趟 直接 选择 排序 得 到 有 序 结果 。 简 单 选 择 排序 代码 
见 算法 8.11， 将 当前 下 标定 义 为 最 小 值 下 标 ， 如 果 有 小 于 当前 最 小 值 的 关键 字 ， 将 此 关键 
字 的 下 标 赋值 给 min， 若 min 不 等 于 i， 说 明 找到 最 小 值 ， 进 行 交换 。 

算法 8.11 简单 选择 排序 


void SelectSort(SqList *L) 人 
( NS 


nt Tjrmins 


for(i=1;i<L->length;i++) ED 
NS 

















min = 1; 


for (j = i+1;j<=L->length;j$+) 
| | 


// 循 环 之 后 的 数据 


if (L->r[min] >L- 
min = j; 六 | 
人 小 1 
en 2 
. 
) 砍 - x 


a 了 AN 
显然 ， 在 前 选择 排序 过 程 中 所 需 进行 记录 移动 的 操作 次 数 较 少 ， 其 最 小 值 为 “0”， 
最 大 值 为 3(n-1)。 然 而 ， 无 论 记 录 的 初始 排列 次 序 如 何 ， 所 需 进 行 的 关键 字 间 的 比较 次 数 
相同 ， 均 为 n(n-1)2。 因 此 ， 总 的 时 间 复 杂 度 也 是 O(n”)。 


8.4.2 ” 堆 排 序 


堆 排 序 (Heap Sort) 只 需要 一 个 记录 大 小 的 辅助 空间 ， 每 个 待 排 序 的 记录 仅 占 有 一 个 存 
储 空间 。 堆 的 定义 如 下 : n 个 元 素 的 序列 {ki,k,,…,k,} 当 且 仅 当 满 足下 关系 时 ， 称 之 为 堆 。 
ks<K [ki>Kk 01, ln 

R 3 Ki 发 Kin i 和 
若 将 和 此 序列 对 应 的 一 维 数组 ( 即 以 一 维 数组 作为 此 序列 的 存储 结构 ) 看 作 一 个 完全 二 
又 树 ， 则 堆 的 含义 表明 ， 完 全 二 又 树 中 所 有 非 终端 结 点 的 值 均 不 大 于 (或 小 于 ) 其 左 、 右 孩 
子 结 点 的 值 。 由 此 ， 若 序列 人 k1,k,,…,k,} 是 堆 ， 则 堆 顶 元 素 (或 完全 二 又 树 的 根 ) 必 为 序列 
中 mm 个 元 素 的 最 小 值 (或 最 大 值 )。 根 结 点 ( 亦 称 为 堆 顶 ) 的 关键 字 是 堆 里 所 有 结 点 关键 字 中 最 
小 者 的 堆 称 为 小 根 扒 。 根 结 点 (也 称 为 堆 顶 ) 的 关键 字 是 堆 里 所 有 结 点 关键 字 中 最 大 者 的 堆 
称 为 大 根 堆 。 例 如 ,下 面 两 个 序列 为 堆 (小 根 堆 、 大 根 堆 ), 对 应 的 完全 二 又 树 如 图 8.8 所 示 。 
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GO nn 


(5) () [10o[1s[s6125130[70 


(a) 小 恨 堆 的 逻辑 结 (b) 小 恨 扒 的 存储 结构 


CC 


(6) 大 根 堆 的 逻 尾 结构 oa 
AN 
图 8.8 ”小 根 堆 和 大 根 堆 示 


从 堆 的 定义 可 以 看 出 ， te ie es nS 则 根 结 点 是 当前 堆 中 所 有 结 点 
的 最 小 者 (或 最 大 者 )。 堆 排序 的 基本 思想 是 as 此 时 ， 
和 它 从 堆 中 移 走 ， 并 将 剩余 的 记录 再 调整 成 
堆 ， 这 样 又 找 出 RO 反复 执行 ， 才能 得 到 一 个 有 序 序列 ， 这 个 过 
程 称 为 堆 排 序 。 

下 面 我 们 讨论 一 下 如 何 利 清 闪 这 排序 wv 3 

在 堆 排序 中 ， 需 要 解决 如 下 两 个 问题 : Pe 个 无 序 序列 建成 一 个 堆 ? @@ 如 何在 
输出 堆 顶 元 素 之 后 ,调整 整 剩余 元 素 成 为 一 个 新 的 

Bi Us > ee 我 们 称 自 顶 至 叶子 的 调整 过 程 为 “ 乌 选 "从 一 个 
无 序 序列 建 就 是 一 个 反复 “筛选 ”的 过 程 。 若 将 此 序列 看 作 一 棵 完全 二 又 树 ， 则 
最 后 一 个 非 终 端 结 点 是 第 | n/2 | 个 元 素 ， 由 此 “筛选 ”只 需 从 第 [n/2 | 个 元 素 开始 。 

例如 ， 图 8.9 中 的 二 叉 树 表示 一 个 有 8 个 元 素 的 无 序 序列 {5.37,48,24.37,16,56,61}。 筛 
选 从 第 4 个 元 素 开 始 ， 由 于 24<61， 则 不 交换 ， 第 3 个 元 素 是 48， 因 为 48>16， 则 交换 之 ; 
于 第 2 个 元 素 37 大 于 24， 则 交换 之 ;因为 第 1 个 元 素 不 大 于 左 、 右 子 树 的 值 ， 则 不 交 
换 。 筛 选 后 的 序列 为 {5,24,16,37,37,48,56,61}。 图 8.9( 所 示 为 筛选 之 后 建成 的 堆 。 
其 次 ， 我 们 来 讨论 第 二 个 问题 。 例 如 ， 图 8.10(a) 是 一 个 堆 ， 假 设 输出 堆 顶 元 素 之 后 ， 
叭 中 最 后 一 个 元 素 替 代 之 ， 如 图 8.10(b) 所 示 。 此 时 根 结 点 的 左 、 右 子 树 均 为 堆 ， 则 仅 需 
上 至 下 进行 调整 即 可 。 首 先 以 堆 顶 元 素 和 其 左 、 右 子 树 根 结 点 的 值 比较 ， 由 于 右 子 树 
结 点 的 值 小 于 左 子 树 根 结 点 的 值 且 小 于 根 结 点 的 值 ， 则 将 16 和 61 交换 ， 由 于 61 替代 
16 之 后 破坏 了 右 子 树 的 “ 堆 ”， 则 需 进行 相同 的 调整 ， 直 至 叶子 结 点 ， 调 整 后 的 状态 
图 8.10(c) 所 示 ， 此 时 堆 顶 为 n-1 个 元 素 中 的 最 小 值 。 重 复 上 述 过 程 ， 将 堆 顶 元 素 16 和 
中 最 后 一 个 元 素 56 交换 且 调 整 ， 得 到 图 8.10(d) 所 示 新 的 堆 。 
根据 图 8.10 所 示 , 如 此 反复 直到 排序 结束 ,对 应 的 序列 为 {5,16,24,37,37,48,56,61}。 相 


的 代码 如 下 。 
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© 
(a) 初始 无 序 序列 (b) 第 选 第 4 个 元 素 的 状态 
© 
omgo 
ooloRoKoolo 


(d) 37 被 筛选 后 的 状态 (e) 第 选 第 1 个 无 素 的 状态 (f) 建成 后 的 堆 
8.9” 建 初始 堆 过 程 


(c) 48 被 得 选 后 的 状态 






© 


(Ga) 扒 (b) 5 和 61 交 换 后 的 情形 


© 


(0) 训 整 后 的 结果 (d) 16 和 56 交 换 后 二 进行 调整 建成 的 新 扒 
图 8.10 输出 堆 顶 元 素 并 调整 建新 堆 的 过 程 图 


1， 由 无 序 到 有 序 的 筛选 过 程 
算法 8.12” 堆 排序 的 筛选 过 程 
void HeapAdjust(SqList *L,int s,int m) 
{ 
int temp,j; 
temp=L->r[s]; 
for(j=2*s;j<=m;j*=2) 


// 沿 关键 字 较 大 的 孩子 结 点 向 下 筛选 


Eo 


© | 


if(j<m && L->r[j]<L->r[j+1]) 


++j; //j 为 关键 字 中 较 大 记录 的 下 标 
if(temp>=L->r[j]) 

break; //rc 应 插入 在 位 置 s 上 
L->r[s]=L->r[j]; 


B= 





L->r[s]=temp; 
} 


2.， 推 排序 的 过 程 
算法 8.13” 堆 排序 的 建 堆 过 程 


void HeapSort(SqList *L) 人 


{ 
i 
for(i=L->length/2;i>0;i--) > 工 中 的 工 构 建成 一 个 大 根 堆 
HeapAdjust(L, i,L->length); Kb 
for(i=L->length;i>1;i--) XX 


' 
swap(L, 1,1); 人 
HeapAdjust(L, ES 
} 
} wt 
在 堆 排序 中 ， ep TE 5 树 的 深度 相同 ， 
因此 ， 与 简 i 另外 ， 不 管 原始 记录 如 何 排列 ， 堆 排序 
的 比较 次 数 所 以 说 ， 堆 排 认 对 坊 谷 记录 的 排列 状态 并 不 敏感 。 在 堆 排序 算法 中 
只 需要 一 个 暂 存 被 筛选 记录 内 容 的 单元 和 两 个 简单 变量 h 和 i， 所 以 堆 排 序 是 一 种 速度 快 
且 省 空间 的 排序 方法 。 堆 排序 是 一 种 不 稳定 的 排序 方法 。 

在 堆 排序 性 能 方面 ， 设 树 高 为 k(k=Llogznj +1)， 从 根 到 叶 的 筛选 ， 关 键 码 比较 次 数 至 
多 为 2(k-1) 次 ， 交 换 记录 至 多 k 次 。 则 在 建 好 堆 后 ， 排 序 过 程 中 的 筛选 次 数 满足 下 式 ， 








2(Llogxn-1)j+Llogx-2)] + … +log22])< 2nlogn (8.6) 
而 建 堆 时 的 比较 次 数 不 超 过 4n 次 , 因此 堆 排 序 最 坏 情况 下 ,时 间 复 杂 度 也 为 O(nlog2n)。 
8.5 归并 排序 








归并 排序 的 基本 操作 是 将 两 个 或 两 个 以 上 的 记录 有 序 序列 归并 为 一 个 有 序 序列 。 二 路 
归并 排序 的 基本 原理 是 : 将 有 n 个 记录 的 竺 排序 列 看 作 n 个 有 序 子 表 ， 每 个 有 序 子 表 的 长 
度 为 1， 然 后 从 第 一 个 有 序 子 表 开始 ， 把 相 邻 的 两 个 有 序 子 表 两 两 合并 ， 得 到 n/2 个 长 度 
为 2 或 1 的 有 序 子 表 ( 当 有 序 子 表 的 个 数 为 奇数 时 ， 最 后 一 组 合并 得 到 的 有 序 子 表 长 度 为 
1)， 这 一 过 程 称 为 一 趟 归并 排序 。 再 将 有 序 子 表 两 两 归并 ， 如 此 反复 ， 直 到 得 到 一 个 长 度 


只 
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为 n 的 有 序 表 为 止 。 上 述 每 趟 归并 排序 都 需要 将 相 邻 的 两 个 有 序 子 表 两 两 合并 成 一 个 有 序 
表 ， 这 种 归并 方法 称 为 二 路 归并 排序 。 
假设 初始 序列 为 {23,56,42,37,15,84,72,27,18}， 采 用 二 路 归并 排序 法 对 该 序列 进行 排 

序 。 整 个 归并 过 程 如 图 8.11 所 示 。 排 序 后 的 结果 为 {15,18,23,27,37,42,56,72,84}。 
初始 关键 子 序列 [23] [56] [42] [37] [15] [84] [72] [27] [18 

T ] 人 T J 人 1 ] L T | 

第 一 趋 归 并 序列 [23 56] [37 42] [15 84] [27 72] [18 

J 


L ] 1 
I T 


第 二 趟 轨 并 序 询 [23 37 42 56] [5 27 72 84] [18 
ee 

















第 三 趋 归 并 序 刻 [15 23 27 37 42 56 72 84] [18 


第 由 趟 归并 序列 iis， 说 元 可 WS 84 


37 A 72 
图 8.11 二 路 归并 排序 习 


设 TR[i...n] 由 两 个 有 序 子 表 SR[i...m] 和 sR 将 两 个 有 序 子 表 合 并 为 一 个 
有 序 表 TR[i...n]。 合 并 代码 表述 如 下 : AN 
算法 8.14 “二 路 归并 排序 2 "RS 


void Merge(int SR[],int TR[] vint mr int n) 
E - 
int j,k; 二 人 








for(j=m+1, k=i;i: & j<=n;k++) 


if ( 了 NS 
ED =SR[i++]; 六 


> 
Le | 


while(i<=m) TR[k++]=SR[i++]; 
while(j<=n) TR[k++]=SR[j++]; 
| 


8.5.1 二 路 归并 的 迭代 算法 


在 每 趟 的 排序 中 ， 首 先 要 解决 分 组 的 问题 ， 设 本 趟 排序 从 R[1] 开 始 ， 长 度 为 len 的 子 
表 有 序 ， 因 为 表 长 n 未 必 是 2 的 整数 寡 ， 这 样 最 后 一 组 就 不 能 保证 恰好 是 表 长 为 len 的 有 序 
表 ， 也 不 能 保证 每 趟 归并 时 都 有 偶数 个 有 序 子 表 ， 这 些 都 要 在 一 趟 排序 中 考虑 到 。 算 法 8.15 
是 一 趟 归并 排序 的 算法 ， 将 SR[ ] 中 相 邻 长 度 为 s 的 子 序列 两 两 归并 到 TR[ ] 。 

算法 8.15 “一 趟 归并 排序 

void MergePass(int SR[],int TR[],int s,int n) 

{ 


@y 











int i=1; 
En 
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算法 8.16 二 路 归并 非 递归 排序 


j， 所 以 空间 复杂 度 为 O(m)。 对 于 n 个 元 

泗 丙 归并 生成 的 子 表 看 作 它 们 的 父 结 点 ， 则 归 

并 过 程 对 应 由 哇 冯 根 生成 一 棵 二 叉 树 的 过 程 。 所 以 归并 赵 数 约 等 于 二 叉 树 的 高 度 -1， 即 
logzan， 每 趟 归并 需 移动 记录 n 次 ， 故 时 间 复 杂 度 为 O(nlog2n)。 


8.5.2 ”二 路 归并 的 递归 算法 
该 算法 利用 递归 ， 将 SR[s.. 旭 归并 排序 为 TR1[s...t]。 工 为 作 归 并 排序 的 顺序 表 。 有 具体 


代码 实现 见 算法 8.17。 
算法 8.17 二 路 归并 递归 排序 
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一 
MSort(SR,TR2,svrD)7 


MSort(SR, TR2,m+l,t)7 
Merge(TR2, TR1, s,m, t); 


void MergeSort(SqList *L) 
k 

MSort(L->r,L->r,1,L->length); 
} 





8.6 基数 排序 


基数 排序 是 一 WG 
码 ” 进 行 排序 的 方法 < 忆 


8.6.1 多 关键 字 排序 人 AN 


先 看 一 个 例子 : Me, ,RAAF 

(1) 花色 : 梅花 < 方块 < 红心 < < 外 

(2) 面值 ; 2<3<4<5<6<7<8<9 10<J<Q<K<A。 

若 对 扑克 牌 按 花色 、 ge FE 序 ， 得 到 如 下 

梅花 2.3,…,AY 方块 2.3,…A: 红心 23 | 黑心 2,3,*… 

Ra 性 小 于 花色 高 的 ， 上 5 ee 
下 ， 大 小 关系 才 由 面值 的 大 小 确定 。 这 就 是 多 关 码 排序 。 

为 得 到 排序 结果 > 我 们 讨论 两 种 方法 ;< 

(1) 先 对 花色 排序 ， 将 其 分 为 4 个 组 ， 即 梅花 组 、 方块 组 、 红 心 组 、 黑 心 组 。 再 对 每 
个 组 分 别 按 面值 进行 排序 。 最 后 ， 将 4 个 组 连接 起 来 即 可 。 

(2) 先 按 13 个 面值 给 出 13 个 编号 组 (2 号 ，3 号 ，…，A 号 )， 将 牌 按 面值 依次 放 入 对 
应 的 编号 组 ， 分 成 13 堆 。 再 按 花色 给 出 4 个 编号 组 (梅花 、 方 块 、 红 心 、 黑 心 )， 将 2 号 组 
中 牌 取出 分 别 放 入 对 应 花色 组 ， 再 将 3 号 组 中 牌 取出 分 别 放 入 对 应 花色 组 …… 这 样 ，4 个 
花色 组 中 均 按 面值 有 序 ， 然 后 ， 将 4 个 花色 组 依次 连接 起 来 即 可 。 

一 般 情 况 下 ， 假 设 有 n 个 记录 的 序列 : 

{RRS (8.7) 

设 n 个 元 素 的 排序 表 中 的 每 个 记录 包含 d 个 关键 码 {K1,K>…,Ks}， 称 序列 对 关键 码 
{区 1,K?,…,K 和 有 序 是 指 : 序列 中 任 两 个 记录 RG 和 RO](1<i<j<n) 都 满足 下 列 有 序 关 系 ， 
上 







































































(KK KE) < (Ky, KY KI) (8.8) 


其 中 K' 称 为 最 主 位 关键 码 ，K" 称 为 最 次 位 关键 码 ， 并 且 一 定 存在 1, 使 得 当 s=1,…，1-1 
时 ，K;=K;, 而 Ki<K;。 


@y 
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多 关键 码 排序 按照 从 最 主 位 关键 码 到 最 次 位 关键 码 或 从 最 次 位 关键 码 到 最 主 位 关键 
码 的 顺序 逐次 排序 ， 分 两 种 方法 : 
(1) 最 主 位 优先 (most significant digit firsb 法 ， 简 称 MSD 法 ， 即 先 按 K! 排序 分 组 ， 同 
一 组 中 记录 ， 关 键 码 K! 相等 ， 再 对 各 组 按 K? 排序 分 成 子 组 ， 之 后 ， 对 后 面 的 关键 码 继续 
这 样 的 排序 分 组 ， 直 到 按 最 次 位 关键 码 K+ 对 各 子 表 排序 后 。 将 各 组 连接 起 来 , 便 得 到 一 个 
有 序 序列 。 扑 克 牌 按 花色 、 面 值 排序 中 介绍 的 方法 即 MSD 法 。 
(2) 最 次 位 优先 (least significant digit first) 法 ， 简 称 LSD 法 ， 即 先 从 K4 开始 排序 ， 再 
对 Ke 进行 排序 ， 依 次 重复 ， 直 到 对 Ki 排序 后 便 得 到 一 个 有 序 序列 。 扑 克 牌 按 花 色 、 贡 
值 排序 中 介绍 的 方法 即 LSD 法 。 


8.6.2 ” 链 式 基数 排序 


将 关键 码 拆 分 为 若干 项 ， 每 项 作为 一 个 “关键 码 ” 则 对 单 关 键 码 的 排序 可 按 多 关键 
码 排序 方法 进行 。 例 如 ， 关 键 码 为 4 位 的 整数 ， 可 以 每 位 对 应 一 页 ， 拆 分 成 4 项 ， 又 如 ， 
关键 码 由 5 个 字符 组 成 的 字符 串 ， 可 以 每 个 字符 作 关键 码 。 由 于 这 样 拆 分 后 ， 每 个 
关键 码 都 在 相同 的 范围 内 (数字 是 0 一 9， 字 符 是 ' KA )， 称 这 样 的 关键 码 可 能 出 现 的 符号 
个 数 为 “ 基 ”， 记 作 RADIX。 he “ 基 ” 为 0， 取 字符 为 关键 码 的 “ 基 ” 
为 26。 基 于 这 一 特性 ， 用 LSD 法 排序 较为 廊 

基数 排序 的 思想 是 ， 从 最 低位 关键 码 起 ， 按 关键 码 的 不 同 值 将 序列 中 的 记录 “分 配 ” 
到 RADIX 个 队列 中 ， 然 后 再 “ 收 ; RE 称 之 为 一 越 排序 第 一 越 排序 之 后 ， 排序 表 中 的 记 
录 已 按 最 低位 关键 码 有 序 ， 再 对 次 展位 关键 码 进行 一 趟 立 分 配 * 和 “收集 ”如 此 直到 对 
最 高 位 关键 码 进行 一 趟 “分 配 夫 和 “收集 ” 则 排序 直 关键 字 有 序 

链 式 基数 排序 是 以 用 链表 作为 排序 表 的 存 结构 用 RADIX 个 链 队 列 作为 分 配 队 列 ， 
关键 码 相同 的 记录 存 司 一 个 链 队 列 中 ,收集 则 是 各 各 链 队列 按 关键 码 大 小 顺序 链接 起 来 。 

We 。 首 先 以 静态 链表 存储 10 个 待 排 记录 ,这 10 个 关键 字 是 十 进 制 
整数 ， 分 别 为 /231、144、037、572、006、249、528、134、065、152。 这 样 ，r=10， 
d=3( 即 基 为 10 且 有 3 个 “关键 码 ” K!、K2、K3 分 别 为 百 位 、 十 位 、 个 位 )。 使 用 基数 
排序 法 对 该 序列 进行 排序 ， 基 数 排序 过 程 如 图 8.12 所 示 。 令 头 指针 指向 第 一 个 记录 ， 
如 图 8.12(a) 所 示 ; 第 一 趟 分 配 在 关键 字 的 个 位 进行 ， 将 链表 中 的 记录 分 配 至 10 个 队 
列 中 去 ， 每 个 队列 中 的 记录 关键 字 的 个 位 数 相同 ， 如 图 8.12(b) 所 示 ， 其 中 F[i] 和 ED 
分 别 为 第 让 个 队列 的 头 指针 和 尾 指针 ; 第 一 趟 收集 是 改变 所 有 非 空 队列 的 队 尾 记录 的 
指针 域 ， 令 其 指向 下 一 个 非 空 队列 的 头 指针 ， 重 新 将 10 个 队列 中 的 记录 链接 成 一 个 
链表 ， 如 图 8.12(c) 所 示 ; 第 二 趟 分 配 、 第 二 趟 收集 及 第 三 趟 分 配 、 第 三 趟 收集 分 别 是 
对 关键 字 的 十 位 数 和 百 位 数 进行 的 ， 其 过 程 和 个 位 数 相 同 ， 如 图 8.12(d) 一 图 8.12(g) 所 

其 中 ， 图 8.12(a) 所 示 为 初始 记录 的 静态 链表 ， 图 8.12(b) 所 示 为 第 一 趟 按 个 位 数 分 配 ， 
修改 结 点 指针 域 ， 将 链表 中 的 记录 分 配 到 相应 链 队列 中 ; 图 8.12(c) 所 示 为 第 一 趟 收集 ， 即 
将 各 队列 链接 起 来 , 形成 单 链表 ; 图 8.12(d) 所 示 为 第 二 趟 按 十 位 数 分 配 , 修改 结 点 指针 域 ， 
将 链表 中 的 记录 分 配 到 相应 链 队 列 中 ; 图 8.12(e) 所 示 为 第 二 趟 收集 , 即将 各 队列 链接 起 来 ， 
形成 单 链表 ， 图 8.12(D 所 示 为 第 三 趟 按 百 位 数 分 配 ， 修 改 结 点 指针 域 ， 将 链表 中 的 记录 分 
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配 到 相应 链 队 列 中 ; 图 8.12(g) 所 示 为 第 三 趟 收集 ， 即 将 各 队列 链接 起 来 ， 形 成 单 链表 。 此 
时 ， 序 列 已 有 序 。 对 应 的 算法 数据 结构 如 下 : 
一 231 一 144 一 037 一 572--006 一 249 一 528 一 134 一 065 一 152 
(a) 初始 记录 的 项 态 链表 
EQ) El) EQ) EG) E4) E(5) E(6)  E7)  EB) E(9) 
| 152 134 
231 | | 
| 572 144 065 006 037 58 249 
FO FID F2) FG) FI FS) FO FO FS F9) 
(b) 第 一 趟 按 个 位 数 分 由 。 下 人 信 
一 231 一 572 一 152 一 144 一 134 一 065 一 006 一 037 二 528 一 249 
(c) 第 一 趟 收集 到 <$ 
EO0) El) EQ) EG)  E(4) HRC a E(7) E(8)  E(9) 
| NEN 
037 / 
| 
134 2 
ye 上 
006 | 231 152 
F(0) FOY CO) 上 F( ”RN F(6) F(8)  F(9) 
| (d) 第 一 是 接 下 位 数 分 本 
006 一 528 一 231 一 134 一 037 一 144 一 249 一 152 一 065 一 572 
(e) 第 一 趟 收集 
EQ) Ed) EQ) EG) ED ES E6 ED Eg) E9) 
065 152 
037 14 249 572 
006 -134 -231 528 


| 上 | | 


FO) FQ) FQ2) FG) F4) FGS) FG FO) FS FO9) 


(f) 第 三 趟 按 太 位 数 分 配 


一 006 一 037 一 065 一 134 一 144 一 152 一 231 一 249 一 528 一 572 


(g) 第 三 趟 收集 
8.12 ” 链 式 基数 排序 


相应 的 链 式 基数 排序 代码 见 算法 8.18 一 算法 8.20， 其 中 是 分 配 算法 ,静态 链 
表 R 中 的 记录 已 按 kyes[0], keys[1],…, keys[i-1] 有 序 ， 码 keys[i] 建 立 RADIX 
个 子 表 ， 使 同一 子 表 中 的 记录 的 keys[i 相 同 ， dae 别 指向 第 i 个 子 表 的 第 一 个 
和 最 后 一 个 记录 ; 算法 8.19 是 收集 算法 ， 按 q[ 1 q[RADIX-1] 所 指 各 子 表 依 次 
链接 成 一 个 链表 ; 算法 8.20 分 别 调用 分 配 算 对 R 进行 基数 排序 ， 使 其 成 为 
按 关 键 码 升序 的 静态 链表 ，R[0] 为 头 结 

算法 8.18 ”分配 算法 


算法 8.19 收集 算法 
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R[t] .next=0; 
} 


算法 8.20 ”基数 排序 
void RadixSort(NodeType R[],int n){ 
Queue q; 
for (i=0;i<n;i++) 
R[i] .next=i+1; 


R[n] .next=0; // 将 R 改 为 静态 链表 
for (i=0;i<KEY NUM;i++) // 分 配 和 收集 
{ Distributel(R, i,q); 
Collect(R, i,q); 
} - 
} .AAA 
从 时 间 效 率 看 ， 设 待 排序 列 为 n 个 记录 ，d 位 关键 码 ,“ 每 位 关键 码 的 取 值 范围 为 0 一 








RADIX-1， 则 

杂 度 为 O(n) 
从 空 | 

指针 。 


链 式 基数 排序 的 时 间 复 杂 度 为 O(d(n+ RADIX))， 其 中, 一 趟 分 配 时 间 复 
- 趟 收集 时 间 复 杂 度 为 O(RADIX),< 共 进行 d 趟 分 配 和 收集 。 
i ， 需 要 2* RADIX 个 队列 头 尾 指针 辅助 空间 ， 以 及 用 于 静态 链表 的 mn 个 











8:7 排序 方法 比较 
对 排序 算法 的 分 析 可 以 从 惧 下 儿 个 方面 进行 : "排序 算法 的 时 间 复 杂 度 、 空 间 复杂 度 和 
稳定 性 。 表 8-2 列 出 了 各 种 排序 算法 的 相关 性 能 。 
表 8-2 各 种 排序 算法 的 相关 性 能 


TT 


O(log n) 


















直接 插入 排序 
冒 泡 排 序 
快速 排序 











O(n log n) 

























简单 选择 排序 O(n’) O(D 
堆 排 序 O(n log n) oO | 

-路 归并 排序 O(n log n) On) 

基数 排序 O(d(n +rd) Ord) 





通过 表 8-2， 我 们 总 结 出 不 同 条 件 下 选择 排序 方法 的 规律 ; 

(1) 若 n 较 小 ， 可 采用 直接 插入 或 简单 选择 排序 。 

当 记 录 规 模 较 小 时 ， 直 接 插入 排序 较 好 ;否则 因为 直接 选择 移动 的 记录 数 少 于 直接 插 
入 ， 应 选 直接 选择 排序 为 宜 。 

(2) 若 文件 初始 状态 基本 有 序 (指正 序 ), 则 应 选用 直接 插入 排序 、 冒 泡 排序 或 快速 排序 为 宜 。 

(3) 车 n 较 大 ， 则 应 采用 时 间 复 杂 度 为 O(nlgn) 的 排序 方法 : 快速 排序 、 堆 排序 或 归并 
排序 。 


Es 


























Ry 排序 
6 ey 


快速 排序 是 目前 基于 比较 的 内 部 排序 中 被 认为 是 最 好 的 方法 ， 当 待 排序 的 关键 字 随 机 
分 布 时 ， 快 速 排序 的 平均 时 间 最 短 ; 

堆 排序 所 需 的 辅助 空间 少 于 快速 排序 ， 并 且 不 会 出 现 快速 排序 可 能 出 现 的 最 坏 情况 。 
但 这 两 种 排序 都 是 不 稳定 的 。 

车 要 求 排序 稳定 ， 则 可 选用 归并 排序 。 但 本 章 介绍 的 从 单个 记录 起 进行 两 两 归并 的 排 
序 算法 并 不 值得 提倡 ， 通 常 可 以 将 它 和 直接 插入 排序 结合 在 一 起 使 用 ， 即 先 利用 直接 插入 
排序 求 得 较 长 的 有 序 子 文件 ， 然 后 两 两 归并 。 因 为 直接 插入 排序 是 稳定 的 ， 所 以 改进 后 的 
归并 排序 仍 是 稳定 的 。 

(4) 在 基于 比较 的 排序 方法 中 ， 每 次 比较 两 个 关键 字 的 大 小 之 后 ， 仅 仅 出 现 两 种 可 
的 转移 ， 因 此 可 以 用 一 棵 二 又 树 来 描述 比较 判定 过 程 。 

当 文 件 的 n 个 关键 字 随 机 分 布 时 ， 任 何 借助 于 “比较 ”的 排序 算法 ， 至 少 需要 的 时 间 
为 O(nlogn)。 p 
基数 排序 只 需 一 步 就 会 引起 m 种 可 能 的 转移 ， 即 把 全 个 记录 装 入 m 个 箱子 之 一 。 
因此 在 一 般 情况 下 ， tt tt 但 是 ， 基 数 
排序 只 适合 用 于 像 字符 串 和 整数 这 类 有 明显 结 人 键 字 , 而 当 关键 字 的 取 值 范围 

合用 基数 排 


















































属于 某 个 无 穷 集 合 (如 实数 型 关键 字 ) 时 ， 无 ; 序 ， 这 时 只 有 借助 于 “比较 ” 
的 方法 来 排序 。 

(5) 有 的 语言 (如 Fortran、Cobol te ) 没 有 提供 指针 及 递归 ， 导 臻 实现 归并 、 快 
沽 0 们 用 过 月 实现 人 何 私 和 过 oo 此 时 可 考虑 采用 其 
他 排序 。 

(6) 本 章 给 出 的 排序 算 演 输入 数据 均 存 储 在 = 深 自 徐 中 。 当 记 录 的 规模 较 大 时 ， 为 
避免 耗费 大 量 的 时 间 去 移动 记录 ， 可 以 用 链表 作为 存储 结构 。 例 如 ,插入 排序 、 归 并 排序 、 
基数 排序 都 易于 在 链 动 次 数 。 但 有 的 排序 方 法 ， 如 快速 排序 和 
堆 排序 ， 在 NS 实现 ， 在 这 种 情况 蔬 》 可 以 提取 关键 字 建 立 索 引 表 ， 然 后 对 索引 表 
进行 排序 。 为 简单 的 方法 是 : 引入 一 个 整 型 向 量 t 作为 辅助 表 ， 排 序 前 令 
t=i(0<i<n), es 换 R 科 和 RR 四], 则 只 需 交换 条 和 0] 即 可 ; 排序 结束 后 ， 
向 量 t 就 指示 了 记录 之 间 的 顺序 关系 : 

Bol key RE key< Rll keey 
























































若 要 求 最 终结 果 
R[O].key<R[1].key<*……<RIn-1].key 
则 可 以 在 排序 结束 后 , 再 按 辅 助 表 所 规定 的 次 序 重 排 各 记录 , 完成 这 种 重 排 的 时 间 是 O(n)。 


8.8 应 用 实践 





8.8.1 和 荷兰 国旗 问题 


设 有 一 个 仅 有 红 、 白 、 蓝 3 种 颜色 的 条 块 组 成 的 条 块 序列 ， 试 编写 一 个 时 间 复 杂 度 为 
O(n) 的 算法 ， 使 得 这 些 条 块 按 红 、 白 、 蓝 的 顺序 排列 ， 即 排 成 荷兰 国旗 图 案 。 
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解 : 这 个 算法 中 设立 了 3 个 指针 。 其 中 ，j 表示 当前 元 素 ，i 以 前 的 元 素 全 部 为 红色 ， 
k 以 后 的 元 素 全 部 为 蓝 色 。 这 样 ， 就 可 以 根据 j 的 颜色 ， 把 其 交换 到 序列 的 前 部 或 者 后 部 。 


8.8.2 双向 冒 泡 问题 


冒 泡 排 序 算法 是 把 大 的 元 素 向 上 移 (气泡 的 上 浮 )， 也 可 以 把 小 的 元 素 向 下 移 (气泡 的 下 
沉 )， 试 给 出 上 浮 和 下 沉 过 程 交替 的 冒 泡 排序 算法 。 
解 : 









2)》 第 8 章 排序 





ba A 


J Wl 
本章 尺 颁 


pp ,和 
Dy 六 

本 章 主 和 内 人 方法 学 本 目的 是 了 解 各 种 排序 方法 的 原理 及 各 
自 的 优 、 缺 点 ”以便 在 编制 软件 时 能 按照 情况 所 需 合理 选用 。 

一 般 来 说 ， 在 选择 排序 方法 时 ， 可 有 下 列 几 种 选择 ; 

(1) 若 待 排序 的 记录 个 数 n 值 较 小 ， 则 可 选用 插入 排序 法 ， 但 若 记 录 所 含 数据 项 较 多 ， 
所 占 存 储量 大 ， 应 选用 选择 排序 法 。 反 之 ， 车 待 排序 的 记录 个 数 n 值 较 大 ， 应 选用 快速 排 
序 法 。 但 车 待 排序 记录 关键 字 有 “有 序 ” 倾 向 时 ， 就 慎 用 快速 排序 ， 而 宁可 选用 堆 排 序 或 
归并 排序 ， 而 后 两 者 的 最 大 差别 是 所 需 辅助 空间 不 等 。 

(2) 快速 排序 和 归并 排序 在 n 值 较 小 时 的 性 能 不 及 直接 插入 排序 ， 因此 在 实际 应 用 时 ， 
可 将 它们 和 插入 排序 “混合 ”使 用 。 例 如 ， 在 快速 排序 划分 子 区 间 的 长 度 小 于 某 值 时 ， 转 
而 调用 直接 插入 排序 ， 或 者 对 待 排 记录 序列 先 逐 段 进行 直接 插入 排序 ， 然 后 利用 “归并 操 
作 ” 进 行 两 两 归并 直至 整个 序列 有 序 为 止 。 

(3) 基数 排序 的 时 间 复 杂 度 为 O(dn)， 因 此 特别 适合 于 待 排 记录 数 n 值 很 大 ， 而 关键 字 
“位 数 d” 较 小 的 情况 ， 并 且 还 可 以 调整 “基数 ”( 如 将 基数 定 为 100 或 1000 等 ) 以 减少 基数 
排序 的 趟 数 d 的 值 。 

(4) 一 般 情况 下 ， 对 单 关 键 字 进 行 排序 时 ， 所 用 的 排序 方法 是 否 稳定 无 关 紧要 。 但 当 
按 “ 最 次 位 优先 ”进行 多 关键 字 排 序 时 ( 除 第 一 趟 外 ) 必 须 选用 稳定 的 排序 方法 。 
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习题 与 思考 


8.1 单 选 题 
1. 下 列 排序 算法 中 ， 稳 定 的 排序 法 是 (。”)。 
A. 直接 选择 排序 ， 归 并 排序 B. 快速 排序 ， 堆 排序 
C. 堆 排序 ， 冒 泡 排 序 D. 归并 排序 ， 冒 泡 排序 
2. 下 列 排 序 算法 中 ， 有 一 种 算法 可 能 会 出 现下 面 的 情况 : 在 最 后 一 趟 排序 开始 之 前 ， 
所 有 元 素 都 不 在 其 最 终 的 位 置 上 ， 这 种 算法 是 ( 。 )。 
A， 插入 排序 B. 快速 排序 C. 冒 泡 排序 D. 堆 排序 
3. 将 序列 {8,9,10,4,5,6,20} 采 用 冒 泡 排 序 排 成 升序 序列 ， 需 要 进行 ( 。 ) 直 (假设 采用 从 








前 向 后 的 扫描 方式 )。 人 
A. 3 B. 4 Co CK. 6 
4. 删除 堆 中 的 一 个 关键 码 的 时 间 复 杂 度 为 ( AA | 
A. O01) B. O(logsn) CC. ON D. OOnlogn) 
5 EE 最 少 的 比较 次 数 是 (。”)。 
A Ta-1 D: nl 
填空 题 
.除了 基数 排序 之 外 ， aa 和 关 
Ms 的 J \ ¢ 


2. 不 受 千 排 序列 初 给 关 态 的 影响 ， 时 间 复杂 度 为 ol ) 的 排序 算法 是 
3. 对 有 n 0 rl.. NS 所 需 的 关键 字 间 的 比较 次 数 是 
x > 


4. 4 用 链表 表 ow 其 中 结 点 中 的 数据 用 data 表示 , 指针 用 next 
表示 ， 链 表 首 指 鲜 为 head， 无 头 结 点 。 








} 


5. 堆 排 序 是 一 种 ”排序 ， 堆 实质 上 是 一 棵 结 点 的 层次 序列 。 对 含有 N 个 











元 素 的 序列 进行 排序 时 ， 堆 排序 的 时 间 复 杂 度 是 ， 所 需 的 附加 存储 结 点 是 
关键 码 序列 {05，23，16，68，94，72，71，73} 是 否 满 足 堆 的 性 质 
8.3 ”思考 题 


1. 解释 下 列 概念 : 

(1) 排序 ，(2) 内 部 排序 ，(3) 堆 ; (4) 稳定 排序 。 

2. 回答 下 列 问 题 : 

(1) 5000 个 无 序 的 数据 , 希望 用 最 快速 度 挑选 出 其 中 前 10 个 最 大 的 元 素 , 在 快速 排序 、 
堆 排 序 、 归 并 排序 和 基数 排序 中 采用 哪 种 方法 最 好 ? 为 什么 ? < 

(2) 大 多 数 排序 算法 都 有 哪 两 个 基本 操作 ? 

3， 有 一 个 待 排序 的 序列 含 7 个 记录 ， 这 7 个 关键 FN 23, 4, 15, 8, 19, 24, 
15， 用 直接 插入 法 对 这 个 序列 进行 排序 。 

4. 有 一 个 待 排序 的 序列 ， 其 中 记录 的 关键 ya 13，72，85，39，41，6，20， 要 
求 在 前 面 7 个 记录 都 已 排 好 序 的 基础 上 ， 采 用 折 半 插入 法 插入 第 8 个 记录 。 

5， 设 有 一 个 待 排 序 的 序列 有 10 个 ， “这 10 个 记录 的 关键 字 分 别 为 58，46，72， 
95, 84, 25, 37, 58, 63, 12, 0 法 对 这 个 序列 进行 排序 。 

6. 一 序列 有 8 个 记录 ， ip 533, 68,95,78,13,26.45}， 用 快速 
排序 法 对 这 个 序列 进行 排序 5 A 

7. 用 J 对 图 8.13 所 示 的 堆 进行 1 序 。? 
























































8.13 堆 


8. 初始 序列 为 {23,56,42,37,15,84,72,27,18}, 请 采用 二 路 归并 排序 法 对 该 序列 进行 排序 

9. 有 一 待 排序 序列 中 有 10 个 记录 ,这 10 个 关键 字 分 别 为 231，144，037，572，006， 
249，528，134，065，152， 使 用 基数 排序 法 对 该 序列 进行 排序 。 

10. 根据 归并 排序 的 概念 ， 采 用 熟悉 的 程序 语言 编写 一 个 二 路 归并 的 算法 。 

11. 根据 本 章 所 学 的 基数 排序 相关 知识 ， 采 用 熟悉 的 程序 语言 编写 一 个 基数 排序 的 算法 。 

12. 输入 50 个 学 生 的 记录 (每 个 学 生 的 记录 包括 学 号 和 成 绩 )， 组 成 记录 数组 ， 然 后 按 
成 绩 由 高 到 低 的 次 序 输出 (每 行 10 个 记录 )。 排 序 方法 采用 选择 排序 





学 悦目 标 


查 
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(1) 理解 查找 表 的 结构 特点 及 各 种 表示 方法 的 适用 性 。 
(2) 熟悉 查找 树 的 构造 方法 和 查找 算法 。 
(3) 熟练 掌握 二 又 查找 树 的 构造 和 查找 方法 。 
(4) 理解 二 叉 平衡 树 的 构造 过 程 。 


(5) 熟练 掌握 哈 希 表 的 构造 方法 ， 深 刻 理解 哈 希 表 与 其 他 结构 表 的 实质 性 差别 。 


Co 


本 章 重点 在 于 理解 查找 表 的 结构 特点 及 各 种 表示 方法 的 特点 和 适用 场合 。 











| 顺序 查找 


折 半 查找 










克基 相近 H 哈 希 函数 的 构造 
从 希 查找 
H 解决 冲突 的 方法 


直 六 图 问题 
EC 


a 


六 分 块 查找 
AVL 搜 索 树 
H B- 树 


B+ 树 


| 哈 希 表 的 概念 


-| 查找 及 分 析 








-| 箱子 装载 问题 





本 章 讨论 的 查找 表 即 为 绪论 中 提 到 的 “集合 ”结构 ， 由 于 它 是 很 多 应 用 软件 中 的 操作 对 象 ， 
因此 本 章 讨论 的 内 容 亦 为 整个 课程 的 重点 之 一 。 由 于 集合 中 的 数据 元 素 之 间 不 存在 任何 关系 ， 
因此 它 的 主要 操作 “查找 ”不 便 进行 ， 为 了 提高 对 查找 表 进 行 查找 的 效率 ， 需 要 以 另 一 种 数据 
结构 表示 。 因 此 在 学 习 本 章 的 过 程 中 应 该 掌握 各 种 表示 方法 的 特点 ， 以 便 在 实用 中 能 灵活 选用 。 
另外 ， 红 黑 树 和 B-/B+ 树 作为 选 学 内 容 加 入 本 章 。 


9.1 基本 概念 


查找 表 由 同一 类 型 的 数据 元 素 (或 记录 ) 构 成 ， 用 于 查找 的 数据 元 素 集合 。 

若 只 对 查找 表 进行 如 下 两 种 操作 : QD 在 查找 表 中 查看 某 个 特定 的 数据 元 素 是 否 在 查找 
表 中 ; @ 检 索 某 个 特定 元 素 的 各 种 属性 ， 则 称 这 类 查找 表 为 静态 查找 表 。 静 态 查找 表 在 查 
找 过 程 中 查找 表 本 身 不 发 生变 化 。 对 静态 查找 表 进行 的 查找 操作 称 为 静态 查找 。 

车 在 查找 过 程 中 可 以 将 查找 表 中 不 存在 的 数据 元 素 插 入 ， 或 者 从 查找 表 中 删除 某 个 数 
据 元 素 , 则 称 这 类 查找 表 为 动态 查找 表 。 动态 查找 表 在 查找 过 程 中 查找 表 可 能 会 发 生变 化 。 
找 表 进行 的 查找 操作 称 为 动态 查找 ! 
数据 元 素 中 的 某 个 数据 项 唯一 能 标识 数据 元 素 (或 记录 ) 的 关键 字 ， 即 每 个 
5 素 的 关键 字 值 互 不 相同 ， 我 们 称 这 种 关键 字 为 主 关键 字 #- 若 查找 表 中 某 些 元 素 的 关键 字 
值 相 同 ， 称 这 种 关键 字 为 次 关键 学 。 例如， 银行 账户 中 的 账号 是 主 关键 字 ， 而 姓名 是 次 关 
键 字 。 p A 国 上 上 总 回 
在 数据 元 素 集合 中 查找 满足 某 种 条 件 的 数据 元 素 的 过 程 称 为 查找 。 最 简单 且 炉 访 灶 
最 常用 的 查找 条 件 是 “关键 字 值 :个 给 定 值 ”。 在 查找 表 搜 索 关键 字 等 于 给 
定 值 的 数据 元 素 (或 记录 )， 若 表 中 存在 这 样 的 记录 ， 则 称 查找 成 功 ， 此 时 的 查找 【参考 图 文 】 
结果 应 给 出 找到 记录 的 全 部 信息 或 指示 找到 记录 的 存储 位 置 ， 若 表 中 不 存在 关键 字 等 于 给 
定 值 的 记录 ， 则 称 查找 不 成 功 ， 此 时 查找 的 结果 可 以 给 出 一 个 空 记录 或 空 指针 。 若 按 主 关 
键 字 查找 ， 查 找 结果 是 唯一 的 ， 若 按 次 关键 字 查找 ， 结 果 可 能 是 多 个 记录 ， 即 结果 可 能 不 
唯 一 








































查找 表 是 一 种 非常 灵活 的 数据 结构 ， 对 于 不 同 的 存储 结构 ， 其 查找 方法 不 同 。 为 了 提 
高 查找 速度 ， 有 时 会 采用 一 些 特殊 的 存储 结构 。 本 章 将 介绍 以 线性 结构 、 树 形 结构 及 哈 希 
结构 为 存储 结构 的 各 种 查找 算法 。 

在 第 1 章 中 曾 提 及 , 可 以 从 3 个 方面 衡量 一 个 算法 的 好 坏 : 时 间 复 杂 度 (衡量 算法 执行 
的 时 间 量 级 )、 空 间 复杂 度 ( 衡 量 算法 的 数据 结构 所 占 存 储 及 大 量 的 附加 存储 ) 和 算法 的 其 他 
性 能 。 对 于 查找 算法 来 说 ， 通 常 只 需要 一 个 或 几 个 辅助 空间 ， 而 查找 算法 中 的 基本 操作 是 
“将 记录 的 关键 字 和 给 定 值 进行 比较 ”， 因 此 ， 通 常 以 “其 关键 字 和 给 定 值 进行 比较 的 记录 
个 数 的 平均 值 ”作为 衡量 查找 算法 好 坏 的 依据 。 

定义 : 查找 过 程 中 先后 和 给 定 值 进行 比较 的 关键 字 个 数 的 期 望 值 称 作 查 找 算法 的 平均 


查找 长 度 (Average Search Length，ASL)。 
© €3 
_ 


























让 
































对 于 含有 n 个 记录 的 查找 表 ， 查 找 成 功 时 的 平均 查找 长 度 为 
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ASL= ypPc (9.1) 
i=l 
ypP-l (9.2) 


其 中 ，P 为 查找 表 中 第 i 个 记录 的 概率 ; Ci 为 找到 表 中 第 i 个 记录 (其 关键 字 等 于 给 定 值 ) 
时 ， 曾 和 给 定 值 进行 过 比较 的 关键 字 的 个 数 。 显 然 ，C; 的 值 将 随 查找 过 程 的 不 同 而 不 同 。 

查找 过 程 的 主要 操作 是 关键 字 的 比较 ， 所 以 通常 以 “平均 比较 次 数 ” 来 衡量 查找 算法 
的 时 间 效率 。 











9.2 静态 查找 


正如 9.1 节 所 述 ， 静 态 查 找 是 指 在 静态 查找 表 上 进 A 在 查找 表 中 查找 满 
足 条 件 的 数据 元 素 的 存储 位 置 或 各 种 属性 。 为 此 本 - A 结构 表示 的 静态 查找 表 
及 相应 的 查找 算法 。 NA 


9.2.1 顺序 查找 "RS WY 
顺序 查找 是 一 种 最 简单 的 查找 7 sa tenements 可 以 是 








顺序 表 ， 也 可 以 是 链表 ， 依 次 用 中 给 定 的 值 与 查找 表 中 数据 元 素 的 关键 字 值 进行 

比较 。 若 某 个 记录 的 关键 字 值 与 给 定 值 相等 ， 则 查 的 多 网 澡 问 污 记录 的 在 人 位置 反之 ， 

车 直 到 最 后 一 个 记录 ， i 
有 序 家 让 让 六 定义 如 下 : 


#define 1 100 mince 


typede t SStable{ 
int Key; 
int otherelem; 
} Se List[MAX NUM], Se Elem; 
假设 在 查找 表 中 ， 数 据 元 素 个 数 为 n(n<MAX_NUM)， 并 分 别 存放 在 数组 的 下 标 变量 
a[l] 一 am 中 。 相 应 的 无 哨兵 顺序 查找 的 完整 代码 见 算法 9.1， 改 进 后 有 哨兵 的 顺序 查找 的 
代码 见 算法 9.2， 对 a[0] 的 关键 字 赋 值 key 作为 哨兵 ， 其 目的 在 于 免 去 查找 过 程 中 每 一 步 都 
要 检测 整个 表 是 否 查 找 完 毕 ， 当 然 “ 哨 兵 ” 也 不 一 定 在 数组 开始 ， 也 可 以 在 末端 。 其 中 a 
为 数组 ，n 为 被 查找 数组 的 元 素 个 数 ，key 为 要 查找 的 关键 字 。 
算法 9.1 无 哨兵 顺序 查找 
int Sequential Search(Se List a,int n,int key) 
汪 
ER 
for(i=1;i<=n;i++){ 
if (a[i] .key == key) 
return i; 





则 查找 失败 ， 返 回 查找 失败 标志 。 



































@y 


} 
return 0; 
} 


算法 9.2 有 哨兵 顺序 查找 


int Sequential Search2(Se List a,int n,int key) 
{ 

re 

a[0] .key = key; 

i=n; 

while(a[i] .key!=key) 


i--; 
性 
return i; 
NS 

对 于 这 种 顺序 查找 算法 来 说 ， 查 找 成 功 最 好 的 情况 就 是 在 第 一 个 位 置 就 找到 了 ， 算 法 
时 间 复杂 度 为 O0)， 最 坏 的 情况 是 在 最 后 位 置 找到 ;| 需要 次 比较 ， 时 间 复杂 度 为 O(n)。 


当 查 找 不 成 功 时 ， 需 要 n+1 次 比较 ， 时 间 复杂 度 为 On)。 我 们 之 前 推导 过 ， 关 键 字 在 任何 
一 人 加 要 兴旺 同 的 ， 所 以 将 拉 为 (mr1)2， 夺 以 最 针 的 时 间 复 杂 讼 是 O(n) 
9.2.2 折 半 查找 Co bg 
J 

1， 折 半 查 找 的 基本 思想 民 XL 
折 半 查找 (二 分 查找 ) 要 录 查 拒 表 用 顺序 存储 结构 存放 且 各 数据 元 素 按 关 键 字 有 序 (天 
序 或 降序 ) 排 列 ， 所 就 是 说 折 半 查找 只 适用 于 对 有 序 顺序 表 进 行 查 找 。 

折 半 查找 的 基本 思想 是 ， 首 先 以 整个 查找 表 作为 查找 范围 ， 用 查找 条 件 中 给 定 值 k 与 
中 间 位 置 结 点 的 关键 字 比较 ， 若 相等 ， 则 查找 成 功 ， 和 否则， 根据 比较 结果 缩小 查找 范围 
如 果 k 的 值 小 于 关键 字 的 值 ， 根 据 查找 表 的 有 序 性 可 知 查找 的 数据 元 素 只 可 能 在 表 的 前 半 
部 分 ， 即 在 左 半 部 分 子 表 中 ， 所 以 继续 对 左 子 表 进 行 折 半 查找 ， 若 K 的 值 大 于 中 间 结 点 的 
关键 字 值 ， 则 可 以 判定 查找 的 数据 元 素 只 可 能 在 表 的 后 半 部 分 ， 即 在 右 半 部 分 子 表 中 ， 所 
以 应 该 继续 对 右 子 表 进行 折 半 查找 。 每 进行 一 次 折 半 查找 ， 要 么 查找 成 功 ， 结 束 查 找 ， 要 
么 将 查找 范围 缩小 一 半 ， 如 此 重复 ， 直 到 查找 成 功 或 查找 范围 缩小 为 空 即 查找 失败 为 止 。 

2. 折 半 查 找 过 程 示例 


假设 待 查 有 序 (升序 ) 顺 序 表 中 数据 元 素 的 关键 字 序 列 为 {8,18,27,42,47,50,56,68， 
95,120}， 用 折 半 查找 关键 字 值 为 27 的 数据 元 素 ， 查 找 过 程 如 图 9.1 所 示 。 

3， 折 半 查 找 算 法 

假设 查找 表 存 放 在 数组 a 的 a[1]~a[n] 中 ， 且 升序 ， 查 找 关 键 字 值 为 k。 

折 半 查找 的 主要 步骤 如 下 : 

(1) 置 初始 查找 范围 : low=1，high=n。 
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a[l] | af[2] | af[3] | a[4] | af[5] | af6] | a[7] | af8] | af9] | a[10] 
8|18|127|42| 147|50|56 |68 | 9 |120 
初始 状态 low1 midf hight 
k<a[mid].key， 喝 新 high | low | midt highf 
k>a[mid].key， 更 新 low lowt | highf 
k=a[mid] key， 查 找 成 功 midf 





9.1 折 半 查找 过 程 示例 


(2) 求 查 找 范围 中 间 项 : mid=(low+high)/2。 

(3) 将 指定 的 关键 字 值 k 与 中 间 项 afmid].key 比较 : 车 相等 , -查找 成 功 ， 找 到 的 数据 
元 素 为 此 时 mid 指向 的 位 置 ， 若 小 于 ， tt low 不 变 ， 高端 数据 
元 素 指针 high 更 新 为 mid-1; 若 大 于 ， 人 针 high 不 变 ， 低 端 数据 
元 素 指 针 low 更 新 为 mid+1 。 
(4) 重复 步骤 (2) 和 (3)， 直 到 查找 成 功 或 查 避 aa 即 查 找 失败 为 止 。 
(5) 如 果 查 找 成 功 , 返回 找到 元 素 的 存 当前 的 中 间 项 位 置 指 针 mid， 否则 返 
回 查找 失败 标志 。 MA 

对 应 上 面 的 描述 ， 折 查 找 的 完整 法 法 93。 

算法 9.3 ” 折 半 查找 


int ee nyint Sr 


int low,hi Wier 

low=1; 二 

highsmy | 伺 - 
whi <=high) [ 

{ 

















mid=(low+high)/2; 
if(key ==a[mid] .key)) return mid; 
if (key<a[mid] .key) high=mid-1; 
else 
low=mid+1; 
. 
return 0; 


找到 有 序 表 中 任 一 记录 的 过 程 就 是 走 了 一 条 从 根 结 点 到 与 该 记录 相应 的 结 点 的 路 径 ， 和 给 
定 值 进行 比较 的 关键 字 个 数 恰好 为 该 结 点 在 判定 树 上 的 层次 数 。 因 此 ， 折 半 查 找 法 在 查找 成 功 
时 进行 比较 的 关键 字 个 数 最 多 不 超过 树 的 深度 , 而 具有 mn 个 结 点 的 判定 树 的 深度 为 | log, n |+1， 
所 以 ， 折 半 查 找 在 查找 成 功 时 和 给 定 值 进行 比较 的 关键 字 个 数 至 多 为 | log, n |+1 。 

最 终 折 半 查找 法 的 时 间 复 杂 度 为 O(logn)， 它 显然 远 远 好 于 时 间 复 杂 度 O(n)， 不 过 
于 折 半 查找 的 前 提 条 件 是 需要 有 序 表 顺序 存储 ， 对 于 静态 查找 表 ， 一 次 排序 后 不 再 变化 ， 


























2 0 


这 样 的 算法 已 经 比较 好 了 。 但 对 于 需要 频繁 执行 插入 或 删除 操作 的 数据 来 说 ， 维 护 有 序 的 
排序 会 带 来 不 小 的 工作 量 ， 不 建议 使 用 。 


9.2.3 ”分 块 查找 
分 块 查找 (Blocking Search) 又 称 索引 顺序 查找 。 它 是 一 种 性 能 介 于 顺序 查找 和 折 半 


之 间 的 查找 方法 。 
分 块 查找 由 “分 块 有 序 ” 的 线性 表 和 索引 表 组 成 。 


1. “分 块 有 序 ” 的 线性 表 

表 R[1...n] 均 分 为 b 块 ， 每 块 中 结 点 个 数 为 s=[ nb] ， 第 b 块 的 结 点 数 不 大 于 s; 每 一 
块 中 的 关键 字 不 一 定 有 序 ， 但 前 一 块 中 的 最 大 关键 字 必 须 小 于 后 一 块 中 的 最 小 关键 字 ， 即 
表 是 “分 块 有 序 ” 的 。 假 定 表 中 每 个 结 点 的 查找 概率 相等 ， Re 14， 决 











网 
竺 








中 每 个 结 点 的 查找 概率 是 1/s。 XS、 
2， 索引 表 < 
抽取 各 块 中 的 最 大 关键 字 及 其 起 始 位 构成 < 个 家 引 家 ID[1...b]， 即 ID[J(i<b) 中 
存放 第 i 块 的 最 大 关键 字 及 该 块 在 表 R 中 的 。 由 于 表 R 是 分 块 有 序 的 ， 所 以 索引 
表 是 一 个 递增 有 序 表 。 A “人 


ee 其 中 恨 只 只 有 18 个 结 点 , 被 分 成 3 块 , 每 块 中 有 
6 个 结 点 ， 第 一 关中 最 大 关键 守 维和 第 二 RN 二 块 中 最 大 关键 字 48 
小 于 第 三 2 


| ss 67 8 "2 13 .14 15: 6 17 18 
RI1..18] [22]12 电 319 rat 5 人 86]53 
TS K 
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ND 上 全 A 
人 IE Key( 关 键 字 ) 




















图 9.2 分 块 有 序 表 的 索引 存储 表示 


分 块 查找 的 基本 思想 是 : 首先 查找 索引 表 ， 索 引 表 是 有 序 表 ， 可 采用 折 半 查找 或 顺序 
查找 ， 以 确定 待 查 的 结 点 在 哪 一 块 ; 然后 在 已 确定 的 块 中 进行 顺序 查找 。 由 于 块 内 无 序 ， 
只 能 用 顺序 查找 。 

对 于 图 9.2 所 示 的 存储 结构 ， 我 们 分 别 作 如 下 查找 。 

) 查找 关键 字 等 于 给 定 值 k=24 的 结 点 
因为 索引 表 小 ， 不 妨 用 顺序 查找 方法 查找 索引 表 。 首 先 将 k 依次 和 索引 表 中 各 关键 字 
比较 ， 直 到 找到 第 一 个 关键 字 大 小 等 于 k 的 结 点 ， 由 于 22<k<48， 所 以 关键 字 为 24 的 结 点 
若 存在 的 话 ， 则 必定 在 第 二 块 中 ; 然后 ， 由 ID[2].addr 找到 第 二 块 的 起 始 地址 7， 从 该 地 
址 开始 在 R[7...12] 中 进行 顺序 查找 ， 直 到 R[11].key=k 为 止 。 

2) 查找 关键 字 等 于 给 定 值 k=30 的 结 点 
因为 22<k<48， 所 以 其 必定 在 第 二 块 ， 然 后 在 该 块 中 查找 。 因 该 块 中 查找 不 成 功 ， 故 
说 明 表 中 不 存在 关键 字 为 30 的 结 点 。 
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下 面 我 们 对 分 块 查找 算法 进行 分 析 ， 由 于 由 索引 项 组 成 的 索引 表 按 关键 字 有 序 ， 则 确定 块 

的 查找 可 用 顺序 查找 ， 也 可 用 折 半 查找 ， 而 块 内 记录 是 无 序 的 ， 则 在 块 内 只 能 是 顺序 查找 。 因 

此 ， 分 块 查找 是 两 次 查找 过 程 。 整 个 查找 过 程 的 平均 查找 长 度 是 两 次 查找 的 平均 查找 长 度 之 和 。 

ASL =L, +L, (9.3) 

其 中 ，Le 为 查找 索引 表 确 定 所 在 块 的 平均 查找 长 度 ，Lw 为 在 块 中 查找 元 素 的 平均 查找 长 度 。 
车 用 顺序 查找 确定 所 在 块 ， 则 分 块 查找 的 平均 查找 长 度 为 


le lee. b+l s+l_1/n 
ASL =L, +L, = 一 +=7 i=——+——==|—+s|+l1 9.4 
. - 52 32 2 人 9 ( ) 
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三 一 这 


可 见 ， 此 时 的 平均 查找 长 度 不 仅 和 表 长 n 有 关 ， 而 且 和 每 一 块 中 的 结 点 个 数 s 有 关 。 
在 给 定 n 的 前 提 下 ，s 是 可 以 选择 的 。 容 易 证 明 ， 当 s 取 Wa 时 ，ASLw 取 最 小 值 Va+l1。 这 
个 值 比 顺序 查找 有 了 很 大 的 改进 ， 但 远 不 及 折 半 查找 。 
若 用 折 半 查找 确定 所 在 块 ， 则 分 块 查找 的 平均 查找 长 度 为 


Astwoetn | (9.5) 
9.3 动 态 查 扫 


本 本。 我 们 动态 相 和 和 现 。 动态 拉 的 和 上 如 机 
在 查找 过 程 中 动态 生成 的 ， 即 对 于 给 定 值 ， 若 表 中 存在 其 关键 字 等 于 给 定 值 的 记录 ， 则 碍 
寺 成 功 反 辐 ， 吾 则 插入 关键 和 给 定 信 的 记录 。 
9.3.1 二 又 排序 机 查 撞 ( XI 


从 二 又 排序 树 的 结 点 定义 中 可 看 到 :, 半 棵 非 宣 二 又 排序 树 中 根 结 点 的 关键 字 值 大 于 其 
左 子 树 上 所 有 结 点 的 关键 字 值 ， 而 小 于 其 右手 树 上 所 有 结 点 的 关键 字 值 ， 所 以 在 二 又 排序 
树 中 查找 一 个 关键 字 值 为 k 的 结 点 的 基本 思想 是 用 给 定 值 k 与 根 结 点 关键 字 值 比 较 ， 如 果 
k 小 于 根 结 点 的 值 ， 则 要 找 的 结 点 只 可 能 在 左 子 树 中 ， 所 以 继续 在 左 子 树 中 查找 ， 和 否则 将 
继续 在 右 子 树 中 查找 ， 依 此 方法 ， 查 找 下 去 ， 直 至 查找 成 功 或 查找 失败 为 止 。 

二 又 排序 树 查找 的 过 程 具体 描述 如 下 。 

(1) 若 二 叉 树 为 空 树 ， 则 查找 失败 。 

(2) 将 给 定 值 k 与 根 结 点 的 关键 字 值 比较 ， 若 相等 ， 则 查找 成 功 。 

(3) 车 根 结 点 的 关键 字 值 小 于 给 定 值 k， 则 在 左 子 树 中 继续 搜索 。 

(4) 否则 ， 在 右 子 树 中 继续 查找 。 

二 又 排序 树 的 查找 过 程 是 一 个 递归 过 程 , 若 用 链 式 存储 结构 存储 , 其 查找 操作 见 算法 9.4。 
该 算法 递归 查找 二 又 排序 树 T 中 是 否 存在 key， 指 针 f 指向 T 的 双亲 ， 其 初始 调用 值 为 
NULL。 若 查找 成 功 ， 则 指针 p 指向 该 数据 元 素 结 点 ， 并 返回 TRUE; 否则， 指针 p 指向 
查找 路 径 上 访问 的 最 后 一 个 结 点 ， 并 返回 FALSE。 

算法 9.4 二 又 排序 树 的 查找 


int SearchBST(BiTree T, int key, BiTree f, BiTree *p) 


















































O 加 


a uu // 查 找 失 败 
pt 本 了 
return FALSE; 

¥ 

else if (key==T->data) { // 查 找 成 功 
pew Ts 
return TRUE; 

. 

else if (key < T->data) 
return SearchBSsT(T->lchild, key,T,Pp); 

else 
return SearchBST(T->rchild, key,T,Pp); 


} ” 


9.3.2 ”AVL 搜索 树 Se 人 险 
KN 

1，AVL 搜索 树 的 基本 概念 

平衡 二 又 树 (self-balancing search tree) 是 由 oN 维尔 斯 (Adelson Velskii)) 和 兰 迪 斯 
(Landis) 于 1962 年 首先 提出 的 ， 这 种 - 二 又 树 在 i 入 和 删除 操作 中 ， 可 以 通过 一 系列 的 旋转 
操作 来 保持 平衡 ， Wale ， 也 称 AVL 树 。 

二 叉 树 中 每 一 个 结 点 的 左 子 Pes 子 树 高 度 称 为 该 结 点 的 平衡 因子 (Balanced 
Factor，BP)。 所 育 平 衡 灶 ， te 或 者 具有 秒 列 性 质 的 二 又 树 ， 它 的 左 子 村 
Re ee 度 之 差 的 绝对 值 不 超过 1。 也 就 是 说 ， 
一 棵 二 又 树 上 任 一 只 能 是 +1， vw 站 的 930) 示 为 一 一 棵 平衡 二 又 树 ， 而 
图 9.3(b) 所 示 为 一 a 二 又 树 。 r 

如 何 构造 二 棵 平衡 二 又 树 呢 ? 动态 地 调整 二 又 排序 树 平衡 的 方法 如 下 : 每 插入 一 个 结 
点 后 ， 首 先 检 破坏 了 树 的 平衡 ， 如 果 因 插入 结 点 而 破坏 了 二 叉 树 的 平衡 ， 则 找 出 离 
插入 点 最 近 的 不 平衡 结 点 ， 然 后 将 该 不 平衡 结 点 为 根 的 子 树 进行 旋转 操作 。 假 设 给 平衡 二 
叉 树 某 个 结 点 的 左 子 树 插入 一 个 新 结 点 ， 则 此 新 结 点 使 左 子 树 的 高 度 加 1， 我 们 可 能 会 遇 
到 以 下 3 种 情况 。 




















(a) 阔 衡 一 叉 树 (b) 不 平衡 一 叉 树 
9.3 ”平衡 二 叉 树 与 不 平衡 二 叉 树 
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(1) 如 果 原 来 其 左 子 树 高 度 与 右 子 树 高 度 相等 , 即 原来 此 结 点 的 平衡 因子 等 于 0, 插入 
新 结 点 后 使 平衡 因子 变 成 +1， 但 仍 符合 平衡 二 叉 树 的 条 件 ， 不 需 对 其 加 以 调整 。 

(2) 如 果 原 来 左 子 树 的 高 度 大 于 右 子 树 的 高 度 ， 即 原来 此 结 点 的 平衡 因子 等 于 +1， 插 
入 新 结 点 后 使 平衡 因子 变 成 +2， 破 坏 了 平衡 二 叉 树 的 限制 条 件 ， 需 对 其 加 以 调整 。 

(3) 如 果 原 来 左 子 树 高 度 小 于 右 子 树 高 度 ， 即 原来 此 结 点 的 平衡 因子 等 于 -1， 插 入 新 
结 点 后 将 使 平衡 因子 变 成 0， 平衡 更 加 改善 ， 不 必 加 以 调整 。 

如 果 给 平衡 二 叉 树 某 结 点 的 右 子 树 插入 一 个 结 点 , 且 设 此 新 结 点 使 右 子 树 的 高 度 加 1， 
则 也 会 遇 到 上 述 相对 应 的 3 种 情况 。 

以 图 9.4 所 示 的 树 为 例 ， 设 原 已 有 关键 字 50、15、60、5 和 35 这 5 个 结 点 ， 原 树 符合 
平衡 二 又 树 条 件 ， 图 中 各 结 点 旁 所 标 数字 为 该 结 点 的 平衡 因子 。 如 插入 关键 字 55 或 70 的 
新 结 点 ， 对 于 关键 字 为 60 的 结 点 来 说 ， 使 平衡 因子 由 0 变 成 +1 或 -1， 属 于 情况 (1)， 而 对 
于 关键 字 50 的 结 点 来 说 ， 使 平衡 因子 由 +1 变 成 0， A 调整 ， 如 插 
入 关键 字 为 2,10,30 或 40 的 任 一 结 点 ， dt 5 点 衡 因子 由 +1 变 
为 +2， 破 坏 了 平衡 二 又 树 的 条 件 ， 需 加 以 调整 使 其 3 
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六 YA、 图 9.4 A 
显然 , AVL 索 竺 的 查找 和 一 又 排序 树 查找 的 算法 一 样 ， 但 插入 操作 和 删除 操作 就 不 
能 完全 按照 二 又 排序 树 的 插入 和 查找 来 进行 ， 因 为 那样 得 到 的 可 能 不 是 AVL 搜索 树 。 

AVL 的 数据 存储 表示 如 下 : 
typedef struct BiTNode // 结 点 结构 
{ 

int data; // 结 点 数据 

LN ED // 结 点 的 平衡 因子 


struct BiTNode *]lchild, *rchild; 
} BiTNode, *BiTree; 


AVL 树 调整 的 基本 操作 包括 如 下 几 部 分 : 


(1)Status InsertAVL(BiTree*T,int e,Status*taller) // 把 数据 存储 到 AVL 树 中 


(2)void L Rotate(BiTree *P) // 单 左旋 转 
(3)void R Rotate(BiTree *P) // 单 右 旋 转 
(4)void LeftBalance(BiTree *T) // 左 平衡 
(5)void RightBalance(BiTree *T) // 右 平衡 





一 般 情 况 下 ， 假 设 由 于 在 二 又 排序 树 上 插入 结 点 而 失去 平衡 的 最 小 子 树 根 结 点 的 指针 


O — 人 


为 p( 即 p 是 离 插入 位 置 最 近 , 且 平 衡 因子 绝对 值 超过 1 的 祖先 结 点 ), 则 失去 平衡 后 进行 调 
整 的 规律 可 归纳 为 下 列 4 种 情况 。 
1) LL 型 平衡 旋转 法 
如 图 9.5 所 示 ， 由 于 在 A 的 左 孩 子 B 的 左 子 树 上 插入 F， 使 A 的 平衡 因子 由 1 增 至 2 
而 失去 平衡 ， 故 进行 一 次 顺 时 针 旋 转 操 作 ， 即 将 A 的 左 孩子 B 向 右上 旋转 代替 A 作为 根 ， 
A 向 右 下 旋转 成 为 B 的 右 子 树 的 根 。 而 原来 B 的 右 子 树 则 变 成 A 的 左 子 树 。 















































< 
(a) 插入 前 (b) 插入 后 A\ | (©) 调 鉴 后 


9.5 LL re 
LL 型 平衡 旋转 法 直接 在 不 平衡 结 点 处 旋 针 ， 代码 见 算 法 9.5。 该 算法 对 以 P 为 根 的 
二 叉 排序 树 作 右 旋 处 理 ， 处 理 之 后 P 指 | 各 即 旋转 处 理 之 前 的 左 子 树 的 根 结 点 
算法 9.5 LL 型 平衡 旋转 法 NAN 


void R 2 


BiTree L; 
L=(*P)->1c P 和 
2 L->rchild; 4 右 子 树 挂 接 为 的 左 子 树 
人 
AAA 

六 

2) RR 型 平衡 旋转 法 








如 图 9.6 所 示 , 由 于 在 A 的 右 孩 子 C 的 右 子 树 上 插入 F, 使 A 的 平衡 因子 由 -1 减 至 -2 





























而 失去 平衡 ， 故 需 进行 一 次 逆 时 针 旋 转 操作 ， 即 将 A 的 右 孩 子 C 向 左上 旋转 代替 A 作为 
根 ，A 向 左下 旋转 成 为 C 的 左 子 树 的 根 。 而 原来 C 的 左 子 树 则 变 成 A 的 右 子 树 。 
-1 








(a) 插入 前 (b) 插入 后 (c) 调整 后 
图 9.6 ”RR 型 平衡 旋转 法 


$f 


RS) 
RR 型 平衡 旋转 法 直接 在 不 平衡 结 点 处 进行 左旋 转 ， 代 码 见 算法 96。 该 算法 对 以 P 为 根 的 
二 又 排序 树 作 左旋 处 理 ， 处 理 之 后 P 指向 新 的 树 根 结 点 ， 即 旋转 处 理 之 前 的 右 子 树 的 根 结 点 。 
算法 9.6 ”RR 型 平衡 旋转 法 
void L Rotate(BiTree *P) 
{ 





BiTree R; 

R=(*P)->rchild; //R 指 向 P 的 右 子 树 根 结 点 
(*P)->rchild=R->lchild; //R 的 左 子 树 挂 接 为 P 的 右 子 树 
R->lchild=(*P); 

*P=R} 


} 











3) LR 型 平衡 旋转 法 A 

如 图 9.7 所 示 ， 由 于 在 A 的 左 孩 子 B 的 右 子 树 上 插入 FE7 得 入 的 平和 子 由 1 增 至 2 
而 失去 平衡 ， 故 需 进行 两 次 旋转 操作 ( 先 逆 时 针 ， 后 顺 时 即 先 将 A 的 左 孩子 B 的 右 子 
树 的 根 E 向 左上 旋转 提升 到 B 的 位 置 ， 然 后 把 E 月 阁 昌 提升 到 A 的 位 置 ， 即 先 使 之 
成 为 LL 型 ， 再 按 LL 型 处 理 。 








(0) 调整 为 LL 蛙 后 (d) 对 LL 型 调整 厂 
9.7 ”LR 型 平衡 旋转 法 
如 图 9.7 所 示 ， 先 将 虚线 部 分 调整 为 平衡 树 ， 然 后 将 其 以 根 按 到 A 的 左 子 树 上 ， 此 时 








成 为 LL 型 ， 再 按 LL 型 处 理 成 平衡 型 。 
4) RL 型 平衡 旋转 法 
如 图 9.8 所 示 , 由 于 在 A 的 右 孩子 C 的 左 子 树 上 插入 F, 使 A 的 平衡 因子 由 -1 减 至 -2 


er 






































而 失去 平衡 ， 故 需 进 行 两 次 旋转 操作 ( 先 顺 时 针 ， 后 逆 时 针 )， 即 先 将 A 的 右 孩 子 C 的 左 于 
树 的 根 D 向 右上 旋转 提升 到 C 的 位 置 ， 然 后 把 该 D 向 左上 旋转 提升 到 A 的 位 置 ， 即 先 使 
之 成 为 RR 型 ， 再 按 RR 型 处 理 成 平衡 型 。 









NS .六 } 
(© 训 正 为 RR 硬 后 1 ,70g) 对 RR 型 训 政 所 
-一 图 9.8 RE 转 法 


DA | Wg 
如 图 9.8 所 示 ~ 尘 将 虚线 部 分 先 调整 为 平衡 料 ， 然 后 将 其 以 根 接 到 A 的 右 子 树 上 ， 此 
en ln PP 
平衡 化 靠 的 就 是 旋转 ， 需 要 注意 的 是 左旋 的 时 候 p->right 一 定 不 为 空 ， 右 旋 的 时 候 
p->left 一 定 不 为 空 。 
如 果 从 空 树 开始 建立 ， 并 时 刻 保持 平衡 ， 那 么 不 平衡 只 会 发 生 在 插入 、 删 除 操作 上 ， 
而 不 平衡 的 标志 就 是 出 现 BF = 2(BF 表示 平衡 因子 ) 或 者 BF= -2 的 结 点 。 

2. AVL 搜索 树 的 插入 实现 


AVL 搜索 树 的 插入 过 程 和 二 又 搜索 树 是 一 样 的 , 但 是 每 次 插入 新 结 点 的 以 后 有 可 能 破 
坏 AVL 搜索 树 的 平衡 性 ， 所 以 每 当 插入 一 个 结 点 时 ， 先 检查 是 否 因 插入 而 破坏 了 树 的 平 
衡 人 性， 若是， 首先 要 找 出 插入 新 结 点 后 失去 平衡 的 最 小 子 树 根 的 指针 。 然 后 调整 这 棵 子 树 
中 有 关 结 点 之 间 的 链接 关系 ， 使 之 成 为 新 的 平衡 子 树 。 当 失去 平衡 的 最 小 子 树 被 调整 为 平 
衡 子 树 后 , 原 有 其 他 所 有 不 平衡 子 树 无 需 调整 ,整个 二 又 排序 树 就 又 成 为 一 棵 平衡 二 叉 树 。 
在 AVL 搜索 树 上 插入 一 个 新 的 数据 元 素 e 的 递归 算法 可 描述 如 下 : 
(1) 车 AVL 搜索 树 为 空 树 ， 则 插入 一 个 数据 元 素 为 e 的 新 结 点 作为 AVL 搜索 树 的 根 ， 


树 的 深度 增加 1。 





























(2) 若 e 的 关键 字 和 AVL 搜索 树 根 的 关键 字 相 等 ， 则 不 进行 插入 。 


衡 因子 更 改 为 0，AVL 搜索 树 的 深度 不 变 。 


更 改 为 +1， 


其 左 、 右 子 树 根 的 平衡 因子 ， 树 的 深度 不 变 。 
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(3) 车 e 的 关键 字 小 于 AVL 搜索 树 的 根 的 关键 字 , 而 且 在 AVL 搜索 树 的 左 子 树 中 不 存 
在 和 e 相同 关键 字 的 ， 则 将 e 插入 AVL 搜索 树 的 左 子 树 上 ,并且 当 插入 后 的 左 子 树 深度 加 
1 时 ， 分 别 就 下 列 不 同情 况 处 理 。 

@ 若 AVL 搜索 树 根 的 平衡 因子 为 -1( 右 子 树 的 深度 大 于 左 子 树 的 深度 )， 则 将 根 的 平 


























@ 若 AVL 搜索 树 根 的 平衡 因子 为 0( 左 子 树 和 右 子 树 的 深度 相等 ), 则 将 根 的 平衡 因子 


AVL 搜索 树 的 深度 加 1。 





图 若 AVL 搜索 树 根 的 平衡 因子 为 +1( 左 子 树 的 深度 大 于 右 子 树 的 深度 )， 则 当 AVL 搜 
索 树 的 左 子 树 根 的 平衡 因子 为 +1 时 ， 需 进行 单 向 右 旋 平衡 处 理 ， 并 且 在 右 旋 处 理 之 后 ， 将 
根 及 其 右 子 树 根 的 平衡 因子 更 改 为 0， 树 的 深度 不 变 ， 当 AVL 搜索 树 的 左 子 树 根 的 平衡 因 
子 为 -1 时 ， 需 进行 先 向 左 、 后 向 右 的 双向 旋转 平衡 处 理 ， 并 且 在 旋转 处 理 之 后 ， 修 改 根 及 























(4) 若 e 的 关键 字 大 于 AVL 搜索 树 根 的 关键 字 , 而 且 在 AVL 搜索 树 的 右 子 树 中 不 存在 
和 e 相同 的 关键 字 , 则 将 e 插入 在 AVL 搜索 树 的 右 子 树 止 ,并 且 当 插入 之 后 的 右 子 树 深度 
加 1 时 ， 分 舞台 认同 二 帘 处 吉之， 其 处 理 操作 和 (3) 中 所 述 相对 称 。 


总 的 来 说 ,向 AVL 树 插入 结 点 时 ， 如 果 当 前 结 点 的 值 大 于 要 插入 的 值 ， 人 
树 ， 和 否则 进入 右 子 树 ， 接着 判断 是 LL 型 还 是 ER 型 。 其 具体 的 














关 现 见 算法 9.7。 该 算 ; 





现 的 操作 如 下 : 若 在 平衡 的 二 又 排序 树 工 中 不 存在 和 e 有 相同 关键 字 的 结 点 ， 则 插入 一 个 


数据 了 





ce 的 新 结 点 ， 并 返回 1 大 则 返回 0。 若 因 插入 而 使 二 又 排序 树 失去 平衡 ， 则 作 


平衡 旋转 处 理 ， 布 尔 变量 taller 反映 于 长 高 与 否 。 
算法 9.7 向 AVL 树 插 入 结 点 


#define LH +17/7 3 3 NS 六 





< 


#define EH 0 /等 高 


ee / 右 高 节 ~ 


Status TasertaVL(Bimree *T,int evStatus *taller) 


{ 


if(!*T) 
{ // 插 入 新 结 点 ， 树 “长 高 ”， 置 taller 为 TRUE 
*T=(BiTree)malloc(sizeof(BiTNode)); 
(*T)->data=e; (*T)->lchild=(*T)->rchild=NULL; (*T)->bf=EH; 
*taller=TRUE; 
3 
else 
{ 
if (e==(*T)->data) 
{ 
*taller=FALSE; return FALSE; 
} 
if (e<(*T)->data) 
{ // 应 继续 在 T 的 左 子 树 中 进行 搜索 
if(!InsertAVL(&(*T)->lchild,e, taller)) 


其 中 ， 左 平衡 旋转 处 理 代码 见 算法 9.8。 该 算法 对 以 指针 T 所 指 结 点 为 根 的 二 又 树 作 
左 平衡 旋转 处 理 。 


人 
| 本 算法 结束 时 ， 指 针 T 指 向 新 的 根 结 点 。 


算法 9.8 左 平衡 旋转 


只 
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右 平 衡 旋转 处 理 代码 见 算法 9.9。 该 算法 对 以 指针 T 所 指 结 点 为 根 的 二 叉 树 作 右 平衡 
旋转 处 理 。 
算法 9.9 右 平衡 旋转 ~ 





O CN 





R1->bf=EH; 

R Rotate(&(*T)->rchild); // 对 了 的 右 子 树 作 右 旋 平 衡 处 理 
L Rotate(T); // 对 了 T 作 左 旋 平衡 处 理 

中 


(1) 如 果 这 3 个 结 点 处 于 一 条 直线 上 ， 则 采用 单 旋转 进行 平衡 化 处 理 。 
(2) 如 果 这 3 个 结 点 处 于 一 条 折线 上 ， 则 采用 双 旋 转 进行 平衡 化 处 理 。 
(3) 本 算法 结束 时 ， 指 针 工 指向 新 的 根 结 点 。 

3，AVL 搜索 树 的 删除 


AVL 搜索 树 中 的 删除 在 二 又 排序 树 删除 的 基础 上 ， 增加 子 本 高 度 变化 后 的 调整 即 可 ， 
这 里 首先 需要 确定 删除 后 ， 哪 个 结 点 的 平衡 需要 调整 ， 具 体 如 于 。 
首先 ， 若 被 删除 结 点 P 只 有 一 个 孩子 ， 只 要 直 把 了 的 双亲 与 该 孩子 相连 即 
可 ; 如 果 P 有 两 个 孩子 ， ea ies 与 了 交换 , 实际 删除 的 是 结 点 L。 
其 次 ， 从 删除 点 开始 回溯 到 树 根 ， 检 查 路 径 二 各 结 点 的 平衡 因子 变化 并 作 相 应 的 修改 
( 阁 需 要 )， 发 生 失衡 就 要 按 类 似 LL、RR、LR 和 RRL 方式 进行 高 度 调整 。 
车 q 是 被 删除 结 点 的 父 结 点 ， CA 生 在 q 的 左 子 树 ， 那 么 BF(q) 减 1; 如 果 删 
除 发 生 在 q 的 右 子 树 ， 那 么 2 x 
根据 q 的 平衡 因子 ， 存 在 /3 种 现象 : -六 让 
现象 1: 如 果 q 的 新 平衡 因子 BF(q)=0， 意 味 着 删除 前 BF (9)=1 或 者 BF (9)=-1， 属 于 
单 支 树 ， 此 时 高 度 减 .1， 和 结 点 的 平衡 因子 ， 如 图 9.9 所 示 。 
9 * 1 
大 /和 沁 
人 4 

















(a) 删除 前 (b) 删除 后 
图 9.9 ”AVL 搜索 树 的 删除 操作 现象 1 


现象 2: 如 果 qd 的 新 平衡 因子 BF (q)=1 或 -1， 意 味 着 删除 前 BF (q)=0， 左 、 右 子 树 高 度 
一 样 。 删 除 操作 发 生 以 后 ，q 的 高 度 不 会 改变 ， 因 此 其 他 的 平衡 因子 不 需要 改变 ， 如 图 9.10 























现象 3: 如 果 q 新 的 平衡 因子 BF (q) = -2 或 2， 意 味 着 删除 前 BF (q) = -1 或 1， 左 、 
右 子 树 高 度 不 同 ， 此 时 树 在 q 结 点 是 不 平衡 的 ， 需 要 平衡 化 处 理 ， 如 图 9.11 所 示 。 
平衡 因子 为 2 或 -2 可 分 为 两 种 情况 : 

若 A 是 第 一 个 删除 后 BF(A)=2 或 -2 的 结 点 ， 可 以 根据 删除 操作 发 生 在 A 的 左 子 树 还 
是 右 子 树 来 划分 不 同 平衡 类 型 。 如 果 删 除 发 生 在 左 子 树 ， 以 及 A 平衡 因子 为 -2 的 情况 , 可 


$f 
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以 把 不 平衡 类 型 称 为 工 型 ， 如 果 删 除 发 生 在 右 子 树 ， 以 及 A 的 平衡 因子 为 2 的 情况 ， 把 这 
种 不 平衡 类 型 称 为 R 型 。 











(a) 删除 前 (b) 删除 后 
9.10 ”AVL 搜索 树 的 删除 操作 现象 2 
































四 删除 前 小 1 \ 2 人 删除 后 
-图 941 AVL 搜索 作 现象 3 
于 工 型 和 及 型 是 对 称 的 ，L 型 情况 下 从 en: 因此 ， 删 除 前 它 的 平衡 因子 
必定 为 -1， 这 样 A 的 右 结 点 (B) 一 定 存在 ， 删除 操作 一 定 发 生 在 A 的 左 子 树 。 可 以 根据 B 
的 平衡 因子 再 细 分 为 L0 型 (BF(B)=0)、L1 型 BFg) =1)、L-1 型 (BF(B)= -1 这 3 种 类 型 。 
1) L0 型 的 平衡 化 处 理 
删除 发 生 在 A 的 左 子 树 且 BF(B) = 0， 如 图 9.12 所 示 。 











ha (CBR), hr (BL) 《BR hr 《BLJn 
(a) 删除 前 (b) 删除 后 (c) 调整 后 
图 9.12 L0 型 的 平衡 化 处 理 
L0 的 调整 实际 上 是 对 A 作 一 次 左旋 得 到 的 。 旋 转 后 A 结 点 的 平衡 因子 变 成 -1，B 结 
点 的 平衡 因子 变 成 1。 此 时 B 结 点 的 父 结 点 以 及 其 他 结 点 都 不 需要 重新 进行 调整 , 因此 0 
型 不 平衡 只 要 一 次 旋转 便 达 到 了 平衡 。 
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9 Eee 


R0 和 1L0 是 对 称 的 , RO 需要 对 A 结 点 作 一 次 右 旋 , 旋转 后 , A 结 点 的 平衡 因子 变 成 1， 
B 结 点 的 平衡 因子 变 成 -1。 
2) L-1 类 型 的 平衡 化 处 理 



































删除 发 生 在 A 的 左 子 树 且 BF (B) = -1， 如 图 9.13 所 示 。 














a ges 
二 
(a) 删除 前 (b) 删除 后 (0) 调整 后 
图 9.13 L-1 类 型 的 平衡 化 处 理 
A 


L-1 型 也 是 一 次 左旋 操作 ， 旋 转 后 A 和 B pd 变 成 了 0， 转 变 成 了 前 边 的 现 
象 1， 按 现象 1 介绍 的 方法 对 B 的 进行 调整 即 可 < Si 
i 








与 L-1 型 对 称 的 是 Rl 型 ，R1 型 需要 4 ， 旋 转 后 A 和 B 的 平衡 因子 也 都 变 

成 0。 / 
3) L1 类 型 的 平衡 化 处 理 XK- 
B)=1， 如 图 9.14 所 未 34 
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(a) 删除 前 (b) 删除 后 (c) 训 整 后 
图 9.14 L1 类 型 的 平衡 化 处 理 


L1 型 是 通过 两 次 旋转 进行 调整 的 ， 先 对 B 结 点 进行 右 旋 ， 再 对 A 结 点 左旋 得 到 。 旋 
转 后 ，C 结 点 的 平衡 因子 变 成 0, A、B 结 点 的 平衡 因子 与 前 面 插入 的 LR 旋转 类 似 ， 需 根 
据 C 结 点 的 平衡 因子 来 决定 。 

(1) 如 果 删 除 后 C 的 平衡 因子 为 0， 表明 调整 后 A、B 的 平衡 因子 为 0。 

(2) 如 果 删 除 后 C 的 平衡 因子 为 -1， 表 明 CL 的 高 度 为 h-2，CR 的 高 度 为 h-1， 调 整 
后 A 的 平衡 因子 为 1，B 的 平衡 因子 为 0。 

(3) 如 果 删 除 后 C 的 平衡 因子 为 1， 表明 CL 的 高 度 为 h-1，CR 的 高 度 为 h-2, 调整 后 
A 的 平衡 因子 为 0，B 的 平衡 因子 为 -1。 

L1 型 调整 以 后 ，C 的 平衡 因子 为 0， 转化 为 前 面 不 平衡 类 型 的 现象 1。R-1 型 和 Ll 型 


是 对 称 的 ， 只 是 将 平衡 因子 1 和 -1 左右 调换 即 可 。 
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把 删除 操作 的 LO、L1、L-1 和 前 面 的 插入 操作 LL、LR 型 进行 比较 可 以 发 现 ，L0、 
L-1 和 LL 型 是 对 称 的 ， 因 此 L0、L-1 和 RR 型 是 一 样 的 ; 并 且 工 -1 和 RR 型 调整 后 A、B 
结 点 的 平衡 因子 也 一 样 。L0 调整 后 的 区 别 是 A、B 结 点 的 平衡 因子 不 同 , L1 型 和 RL 型 是 
完全 一 样 的 。 

9.3.3” 红 黑 树 

， 红 黑 树 的 基本 概念 

红 黑 树 是 一 种 平衡 二 又 搜索 树 ， 是 在 计算 机 科学 中 用 到 的 一 种 数据 结构 ， 典 型 的 用 途 
是 实现 关联 数组 。 它 是 在 1972 年 由 Rudolf Bayer 发 明 的 ， 他 称 之 为 “对 称 二 又 B 树 ”， 
现代 的 名 字 起 源 于 Leo J Guibas 和 Robert Sedgewick 于 1978 年 写 的 一 篇 论文 。 它 是 复杂 
的 , 但 它 的 操作 有 着 良好 的 最 坏 情况 运行 时 间 , 并 且 在 实践 中 是 高 效 的 : 它 可 以 在 O(log n) 
时 间 内 作 查 找 、 插 入 和 删除 操作 ， 这 里 的 n 是 树 中 元 素 的 数目 。 

红 黑 树 和 AVL 树 一 样 ， 都 对 插入 时 间 、 删 除 时 间 和 寺 间 提供 了 最 好 可 能 的 最 坏 
情况 担保 。 这 不 只 是 使 它们 在 时 间 敏 感 的 应 用 如 即时 放 用 (real time application) 中 有 价值 ， 
而 县 使 它们 有 在 提供 最 坏 情况 担保 的 其 他 数据 结构 中 建造 板块 的 价值 。 例 如 ， 在 计算 
几何 中 使 用 的 很 多 数据 结构 都 可 以 基于 红 黑 > XN 

注意 : -人 YY 

(1) 于 红 黑 树 也 是 二 又 查找 树 必 宪 们 当中 每 一 个 结 点 的 比较 值 都 必须 大 于 或 等 于 它 
的 左 子 树 中 的 所 有 结 点 ， 并 且 小 了 多 于 它 的 右 子 峙 中 有 结 点 。 这 确保 红 黑 树 运作 时 
能 够 快速 地 在 树 中 查找 给 定 的 值 。、 ,A 
(2) 如 果 一 个 结 点 没有 儿子 ， 我 们 称 之 为 叶 所 因为 直觉 上 它 在 树 的 边缘 上 。 子 
树 是 从 特定 结 点 可 以 延伸 到 的 树 的 某 一 部 分 下身 当 作 一 个 树 。 在 红 黑 树 中 ， 叶 子 被 
假定 为 null( 空 或 者 是 黑 哨 兵 。 x 

(3) 虽然 删除 很 复杂 ， 但 操作 时 间 仍 可 以 保持 为 O(log n)。 

对 于 任何 有 效 的 红 黑 树 ， 我 们 增加 了 如 下 的 额外 要 求 : 

性 质 1 每 个 结 点 要 么 是 红色 的 ， 要 么 是 黑色 的 。 

性 质 2 根 结 点 是 黑色 的 。 

性 质 3 每 个 叶子 结 点 都 带 有 两 个 空 的 黑色 结 点 (被 称 为 黑 哨 兵 )。 如 果 一 个 结 点 n 的 
只 有 一 个 左 孩 子 ， 那 么 n 的 右 孩 子 是 一 个 黑 哨 兵 ， 如 果 结 点 n 只 有 一 个 右 孩 子 ， 那 么 n 的 
左 孩 子 是 一 个 黑 哨兵 。 

性 质 4 每 个 红色 结 点 的 两 个 子 结 点 都 是 黑色 (从 每 个 叶子 到 根 的 所 有 路 径 上 不 能 有 
两 个 连续 的 红色 结 点 ); 

性 质 5 从 任 一 结 点 到 其 每 个 叶子 的 所 有 路 径 都 包含 相同 数目 的 黑色 结 点 。 

图 9.15 便 是 一 棵 红 黑 树 ， 从 根 结 点 到 任 一 叶子 结 点 的 路 径 上 都 有 相同 的 黑色 结 点 ， 整 

棵 树 中 不 存在 连续 的 两 个 红色 结 点 。 
这 些 约束 强制 了 红 黑 树 的 关键 性 质 : 从 根 到 叶子 的 最 长 的 可 能 路 径 不 超过 最 短 的 可 能 
路 径 的 两 倍 长 ， 结 果 是 这 个 树 大 致 上 是 平衡 的 。 因 为 操作 如 插入 、 删 除 和 查找 某 个 值 的 最 
坏 情 况 时 间 都 要 求 与 树 的 高 度 成 比例 ， 这 个 在 高 度 上 的 理论 上 限 允 许 红 黑 树 在 最 坏 情况 下 
都 是 高 效 的 ， 而 不 同 于 普通 的 二 又 搜索 树 。 
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图 9.15 红 黑 树 







四 性 质 4. 导 致 了 路 径 不 能 有 两 个 毗连 的 
里 色 结 点 ， 最 长 的 可 能 路 径 有 交替 的 红色 结 点 和 
。 因 为 根据 性 质 $， 即 所 有 最 长 的 路 径 都 有 相同 数目 的 黑色 结 点 ， 可 知 没 有 路 径 





i 
狠 次 





能 多 于 任何 其 他 路 径 的 两 倍 长 。 





在 很 多 树 数据 结构 的 表示 中 , 一 个 结 点 有 可 能 只 有 一 个 子 结 
用 这 种 范例 表示 红 黑 树 是 可 能 的 ， 但 是 这 会 改变 一 些 属性 并 使 
使 用 


绘图 中 经 


点 ， 而 叶子 结 点 包含 数 挤 
法 复杂 。 为 此 ， 这 生 
， 如 图 9.15 所 示 , “ 它 不 包含 数据 而 只 充当 树 在 此 结束 的 标志 。 这 




















被 省 略 ， 导 致 这 些 树 好 像 同 上 述 原则 相 了 矛盾 二 向 实际 上 不 是 这 样 。 
结论 是 所 有 结 点 都 有 两 个 子 结 点 ， 尽 管 其 中 的 一 个 或 两 个 可 能 是 空 叶子 。 
2.， 红 黑 树 的 旋转 
为 了 实现 红 黑 树 的 建立 与 旋转 功能 证 我 们 定义 红 黑 树 的 存储 表示 如 下 
typedef el RBTNode 
int key; 


struct RBTNode *parent,*left,*right; 

int color; 

int size; // 扩 张 红 黑 树 
}RBTNode, *RBTree; 


当 我 们 在 对 红 黑 树 进行 插入 和 删除 等 操作 时 ， 对 树 作 了 修改 ， 那 么 很 可 能 会 违背 红 黑 
树 的 性 质 。 为 了 保持 红 黑 树 的 性 质 ， 我 们 可 以 通过 对 树 进行 旋转 ， 即 修改 树 中 某 些 结 点 的 
顷 色 及 指针 结构 ， 以 达到 对 红 黑 树 进行 插入 、 删 除 等 操作 时 ， 红 黑 树 依然 能 保持 它 特 有 的 
性 质 。 红 黑 树 的 旋转 ， 分 为 左旋 和 右 旋 ， 下 面 借助 图 来 作 形 象 的 解释 和 介绍 。 
1) 左旋 
在 某 个 结 点 pivot 上 (以 x 代替 结 点 pivot) 上 作 左 旋 操 作 时 , 如 图 9.16 所 示 , 以 x->y 之 
间 的 链 为 “ 支 轴 ”进行 ，y 成 为 该 新 子 树 的 根 ，x 成 为 y 的 左 孩 子 ， 而 y 的 左 孩子 则 成 为 x 
的 右 孩子 ， 相 应 的 代码 见 算法 9.10。 





ss 

















数据 结构 与 算法 应 用 实践 教程 (第 己 


J 





ORG 


图 9.16 红 黑 树 左旋 
算法 9.10” 红 黑 树 左旋 





2) 右 旋 

右 旋 操作 与 左旋 操作 差不多 ， 如 图 9.17 所 示 ， 在 此 不 作 详细 介绍 。 

对 于 树 的 旋转 ， 能 保持 不 变 的 只 有 原 树 搜索 性 质 ， 而 原 树 的 红 黑 性 质 则 不 能 保持 ， 在 
红 黑 树 的 数据 插入 和 删除 后 可 利用 旋转 和 颜色 重 涂 来 恢复 树 的 红 黑 性 质 。 


3， 红 黑 树 的 插入 操作 


我 们 首先 用 二 又 搜 索 树 的 方法 增加 结 点 并 标记 它 为 红色 。 如 果 设 为 黑色 ， 就 会 导致 根 
到 叶子 的 路 径 上 有 一 条 路 径 上 ， 多 一 个 额外 的 黑 结 点 ， 这 个 是 很 难 调整 的 。 但 是 设 为 红色 
结 点 后 ， 可 能 会 导致 出 现 两 个 连续 红色 结 点 的 冲突 ， 那 么 可 以 通过 颜色 调换 (color flips) 和 
树 旋转 来 调整 。 下 面 要 进行 什么 操作 取决 于 其 他 临近 结 点 的 颜色 。 同 人 类 的 家 族 树 一 样 ， 
我 们 将 使 用 术语 叔父 结 点 来 指 一 个 结 点 的 父 结 点 的 兄弟 结 点 。 


@r 





图 9.17 红 黑 树 右 旋 


(1) 性 质 1 中 结 和 
(2) 性 质 4 中 每 个 红色 结 点 的 两 个 子 结 A 点 、 重 绘 黑色 


结 点 为 红色 ， 或 作 旋 转 时 受到 影响 。 
ee i 相同 数目 的 黑色 结 点 。 只 在 增加 黑 
色 结 点 、 重 绘 红色 结 点 为 黑色 ， 或 作 旋转 时 受 到 影 





在 图 9.18 中 ， 将 要 插入 的 结 N 的 父 结 点 标 为 P，N 的 祖父 结 点 标 为 G 
的 叔父 结 点 标 为 U。 在 图 中 展示 NE 和 和 所 色情 所 作 的 全， WE 
假定 所 暗含 的 。 

对 于 每 一 种 情况 ， a 可 以 找到 一 
个 结 点 的 叔父 结 点 和 祖 多 结 点 。 NS 

算法 9.11 章 和 上 人 结 吉 和 租 父 结 直 并 从 


node gr: rénit(node n) 9 4 
{ 




















return n->parent->parent; // 返 回 祖父 结 点 
} 


node uncle(node n) { 
if (n->parent == grandparent(n)->left) 


return grandparent(n)->right; // 返 回 叔 父 结 点 
else 


return grandparent(n)->left; // 返 回 叔 父 结 点 
} 
情形 1 新 结 点 N 位 于 树 的 根 上 ， 没 有 父 结 点 
在 这 种 情形 下 ， 我 们 把 它 重 绘 为 黑色 以 满足 性 质 2。 因 为 它 在 每 个 路 径 上 对 黑 结 点 数 
目 增加 1， 符合 性 质 5。 具 体 代码 见 算法 9.12。 
算法 9.12” 红 黑 树 插入 后 的 情形 1 


void insert casel(node n) 





if (n->parent == NULL) 
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n->color = BLACK; 
else 


insert case2(n); // 转 到 下 述 情 形 处 理 

} 

情形 2 新 结 点 的 父 结 点 P 是 黑色 。 

在 这 种 情形 下 ， 树 仍 是 有 效 的 。 性 质 4 没有 失效 (新 结 点 是 红色 的 )， 性 质 5 也 未 受到 
威胁 ， 尽 管 新 结 点 N 有 两 个 黑色 叶子 结 点 ; 但 由 于 新 结 点 N 是 红色 ,通过 它 的 每 个 子 结 点 
的 路 径 都 有 同 通过 它 所 取代 的 黑色 叶子 结 点 的 路 径 同样 数目 的 黑色 结 点 ， 所 以 依然 满足 性 
质 5。 具 体 代码 见 算法 9.13。 

算法 9.13” 红 黑 树 插入 后 的 情形 2 


void insert case2(node n) 











{ 险 
if (n->parent->color == BLACK) 
return; / moi 
else 
insert_ case3(n); CO 


} 


情形 3 如果 父 结 点 P 和 叔父 结 点 已 二 者 都 是 红色 。 

此 时 新 插入 结 点 N 作为 P 的 左 子 结 点 或 右 子 结 点 都 属于 情形 3[ 这 里 图 9.18(b) 仅 显示 
结 点 N 作为 P 的 左 子 结 点 的 情形 ] 光 则 我 们 可 以 将 它们 两 余 重 绘 为 黑色 并 重 绘 祖父 结 点 G 
为 红色 (用 来 保持 性 质 4)。 

现在 我 们 的 新 结 点 对 有 了 一 个 黑色 的 父 
何 路 径 都 必定 通过 祖父 结 点 G， 在 这 些 路 径 
结 点 G 的 父 结 点 也 有 可 能 是 红色 的 ， 这 就 违 到 了 性 质 4。 为 了 解决 这 个 问题 我 们 在 祖父 
结 点 G 上 递归 地 进行 情形 1 的 整个 过 程 。 如 图 9.18 所 示 ， 其 相应 的 代码 见 算法 9.14。 







P 或 人 结 点 的 任 





—> 


(a) 调整 前 (b) 调整 后 
图 9.18 ” 红 黑 树 插入 后 的 情形 3 
算法 9.14” 红 黑 树 插入 后 的 情形 3 
void insert_case3(node D) 
if (uncle(n) != NULL && uncle(n)->color == RED) { 
n->parent->color = BLACK; 


uncle(n)->color = BLACK; 
grandparent(n)->color = RED; 








insert_casel(grandparent(n)); // 为 祖父 结 点 的 父 结 点 可 能 是 红色 的 ， 违 
反 性 质 ， 递 归 情 形 











}else 


insert_ case4(n); // 转 到 下 述 情 形 处 理 
} 


在 余下 的 情形 下 , 我 们 假定 父 结 点 P 是 其 父亲 G 的 左 子 结 点 。 如 果 它 是 右 子 结 点 ， 
情形 4 和 情形 5 中 的 左 和 右 应 当 对 调 。 










情形 4 父 结 点 P 是 红色 的 而 叔父 结 点 UU 是 黑色 的 , 并 且 新 结 点 N 是 其 父 结 点 P 的 右 








子 结 点 ， 而 父 结 点 P 又 是 其 父 结 点 的 左 子 结 点 
在 这 种 情形 下 ， 我 们 进 左旋 转调 换 新 结 点 和 其 父 结 点 的 角色 。 





导致 某 些 路 径 通 i 通过 的 新 结 点 N( 如 图 9.19 -中 小 号 叶子 结 点 ) 或 不 通 
P( 如 图 9.19 中 3 号 叶子 结 点 )， 但 由 于 这 两 个 结 点 都 是 红色 的 ， 所 以 性 质 5 仍 有 效 。 接 者 
形 5 处 理 以 前 的 父 结 点 P 以 解决 仍然 失效 的 性 质 4。 如 图 9.19 所 示 ， 其 相应 的 代 
码 见 算法 9.15。 








2 3 1 2 
(a) 调整 前 (b) 调整 后 


9.19” 红 黑 树 插入 后 的 情形 4 


算法 9.15” 红 黑 树 插入 后 的 情形 4 


void insert case4(node n) 








{ 
if (n == n->parent->right && n->parent == grandparent(n)->left) { 
rotate left(n->parent); // 父 结 点 左旋 
n= n->left; 
} else if (n == n->parent->left && n->parent == grandparent(n)->right) { 
rotate right(n->parent); // 父 结 点 右 旋 
n = n->right; 
] 
insert_ caseS(n); // 转 到 下 述 情形 处 理 
} 
情形 5 父 结 点 P 是 红色 的 而 叔父 结 点 U 是 黑色 的 , 并 且 新 结 点 N 是 其 父 结 点 的 左 子 
结 点 ， 而 父 结 点 了 又 是 其 父 结 点 G 的 左 子 结 点 。 
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在 这 种 情形 下 ， 我 们 进行 针对 祖父 结 点 G 的 一 次 右 旋转 。 在 旋转 产生 的 树 中 ， 以 前 的 
父 结 点 了 现在 是 新 结 点 N 和 以 前 的 祖父 结 点 G 的 父 结 点 。 我 们 知道 以 前 的 祖父 结 点 G 是 
黑色 ， 和 否则 父 结 点 P 就 不 可 能 是 红色 (如 果 P 和 G 都 是 红色 就 违反 了 性 质 4， 所 以 G 必须 
是 黑色 )。 我 们 交换 以 前 的 父 结 点 P 和 祖父 结 点 G 的 颜色 ， 结 果 满 足 性 质 4。 性 质 5 也 仍然 
有 效 ， 因 为 通过 这 3 个 结 点 中 任何 一 个 的 所 有 路 径 以 前 都 通过 祖父 结 点 G， 现 在 它们 都 通 
i 结 点 P。 在 各 自 的 情形 下 ， 这 都 是 3 个 结 点 中 唯一 的 黑 如 图 9.20 
所 示 ， 其 相应 的 代码 见 算法 9.16。 























—> 


(a) 调整 前 tbj 调整 后 
图 9.20” 红 黑 树 插入 后 的 情形 5 


算法 9.16” 红 黑 树 插入 后 的 情形 5 


void insert caseS(node n) . k> 
ee NS 


yO 
n->parent->color = SOC Re 
grandparent(n)->col6r = RED; / 祖父 结 岂 色 变 为 红色 
if (n == n->pareht->left && n->parent =+ grandparent(n)->left) { 
rotate ri 六 父 结 点 右 旋 
} else DS Co bb 4 
, “7 // 相 反 情况 ， N A 而 父 结 点 P 又 是 其 父 G 的 右 孩 子 
NS 


注意 
壬 入 实际 上 是 原 地 算法 ， 因 为 上 述 所 有 调用 都 使 用 了 尾部 递归 . 
4， 红 黑 树 的 删除 操作 


如 果 需 要 删除 的 结 点 有 两 个 儿子 ， 那 么 问题 可 以 转化 成 删除 另 一 个 只 有 一 个 儿子 的 结 
点 的 问题 (为 了 表述 方便 ， 这 里 所 指 的 儿子 ， 为 非 叶 子 结 点 的 儿子 )。 对 于 二 叉 查找 树 ， 在 
删除 带 有 两 个 非 叶子 儿子 的 结 点 的 时 候 ， 我 们 要 么 找到 在 它 的 左 子 树 中 的 最 大 元 素 ， 要 么 
找到 在 它 的 右 子 树 中 的 最 小 元 素 ， 并 把 它 的 值 转移 到 要 删除 的 结 点 中 。 我 们 接着 删除 我 们 
从 中 复制 出 值 的 那个 结 点 ， 它 必定 有 少 于 两 个 非 叶 子 的 儿子 。 因 为 只 是 复制 了 一 个 值 而 不 
违反 任何 性 质 ， 这 就 把 问题 简化 为 如 何 删除 最 多 有 一 个 儿子 的 结 点 的 问题 。 它 不 关心 这 个 
结 点 是 最 初 要 删除 的 结 点 还 是 我 们 从 中 复制 出 值 的 那个 结 点 。 如 图 9.21 所 示 ， 当 删除 结 点 
20 时 ， 实 际 被 删除 的 结 点 应 该 为 18， 结 点 20 的 数据 变 为 18。 













































在 本 节 中 ， 我 们 只 需要 讨论 删除 只 有 一 个 儿子 结 点 的 情形 。 如 果 删 除 一 个 红色 结 点 ， 











它 的 父亲 和 儿子 一 定 是 黑色 的 。 所 以 可 以 简单 地 用 它 的 黑色 儿子 替换 它 ， 并 不 会 破坏 性 质 
3 和 性 质 4。 通过 被 删除 结 点 的 所 有 路 径 只 是 少 了 一 个 红色 结 点 , 这 样 可 以 继续 保证 性 质 5。 


另 一 























种 简单 情况 是 在 被 删除 结 点 是 黑色 而 它 的 儿子 是 红色 的 时 候 。 如 果 只 是 删除 这 个 黑色 





结 点 ， 用 它 的 红色 儿子 顶 奉 上 来 的 话 ， 会 破坏 性 质 4， 但 是 如 果 我 们 重 绘 它 的 儿子 为 黑色 ， 
则 曾经 通过 它 的 所 有 路 径 将 通过 它 的 黑色 儿子 ， 这 样 可 以 继续 保持 性 质 4。 所 以 可 以 推断 











出 ， 在 进行 删除 操作 时 根据 红 黑 树 的 性 质 可 以 得 出 以 下 两 个 结论 : 








(1) 删除 操作 中 真正 被 删除 的 必定 是 只 有 一 个 红色 孩子 或 没有 孩子 的 结 点 。 
(2) 如 果真 正 的 删除 点 是 一 个 红色 结 点 ， 那 么 它 必 定 是 一 个 叶子 结 点 。 
理解 这 两 点 非常 重要 ， 如 图 9.22 所 示 ， 除 了 图 9.22(a) 所 示 情 况 外 ， 其 他 任 一 种 情况 下 








结 点 N 都 无 法 满足 红 黑 树 性 质 。 


(9 
& © 
(5 ) 18) 一 支 下 被 删除 的 结 设 (5) Qo) 
(9 G (9 


(a) 删除 结 点 前 (b) 删除 结 点 后 
图 9.21 删除 结 点 20 


中 


(a) 正确 (b) 违反 性 质 5 (ce) 违反 性 质 2、5 〈d) 违反 性 质 2、4 (e) 违反 性 质 4 。 “(f) 违反 性 质 4、5 


图 9.22 单 支 结 点 
需要 进一步 讨论 的 是 要 删除 的 结 点 和 它 的 儿子 二 者 都 是 黑色 的 情形 ， 这 是 一 种 复杂 的 


情况 。 我 们 首先 把 要 删除 的 结 点 替换 为 它 的 儿子 。 出 于 方便 ， 称 这 个 儿子 为 N， 称 它 的 兄 
弟 ( 它 父 亲 的 另 一 个 儿子 ) 为 S。 在 下 面 的 示意 图 中 ， 使 用 P 表示 N 的 父亲 ，Sr 表 示 S 的 左 
儿子 ，SR 表 示 $ 的 右 儿子 。 我 们 将 使 用 算法 9.17 所 示 函 数 找到 兄弟 结 点 。 












































算法 9.17 ”查找 兄弟 结 点 


struct node *sibling(struct node *n) // 找 兄弟 结 点 
{ 
if (n == n->parent->left) 
return n->parent->right; // 返 回 兄弟 结 点 
elae 
return n->parent->left; // 返 回 兄弟 结 点 
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如 果 N 和 它 初始 的 父亲 是 黑色 ， 则 删除 它 的 父亲 导致 通过 N 的 路 径 都 比 不 通过 它 的 路 
径 少 了 一 个 黑色 结 点 。 因 为 这 违反 了 性 质 5， 树 需要 重新 平衡 化 。 有 以 下 几 种 情形 需要 
情形 1 N 是 新 的 根 。 


在 这 种 情况 下 ， 就 是 从 所 有 路 径 去 除了 一 个 黑色 结 点 ， 而 新 根 是 黑色 的 ， 所 以 性 质 都 
保持 着 。 


算法 9.18 ” 红 黑 树 删除 后 的 情形 1 


void delete_casel(struct node *n) 
{ 




















if (n->parent != NULL) 
delete_case2(n); // 转 到 下 述 情形 
| 


YA 


注意 


在 情形 2、5 和 6 下 ， 我 们 假定 N 是 它 父 亲 的 左 几 子 。 如 果 它 是 右 儿 子 ， 则 在 这 些 
情形 下 的 左 和 右 应 当 对 调 。 






情形 2 兄弟 结 点 S 是 红色 。 


在 这 种 情形 下 , 我 们 在 N 的 父亲 结 点 上 作 左 旋转 ,把 红色 兄弟 转换 成 N 的 祖父 。 接 着 
对 调 N 的 父亲 和 祖父 的 颜色 , 所 有 的 路 径 仍然 有 相同 数 旧 的 黑色 结 点 。 现 在 N 有 了 一 个 黑 
色 的 兄弟 和 一 个 红色 的 父亲 ;我们 可 以 按 情形 4、S 或 情形 .6 来 处 理 。 如 图 9.23 所 示 ， 其 
相应 的 代码 见 算 法 9.19。 








(a) 调整 前 (b) 调整 后 


图 9.23 ” 红 黑 树 删 除 后 的 情形 2 
算法 9.19 红 黑 树 删除 后 的 情形 2 
void delete case2(struct node *n) 
{ 


struct node *s = sibling(n); 
if (s->color == RED) { 
n->parent->color = RED; 
s->color = BLACK; 
if (n == n->parent->left) 
rotate left(n->parent); 
else 


//n 是 父 结 点 的 左 孩 子 
// 父 结 点 左旋 


rotate right(n->parent); // 父 结 点 右 旋 


3 
delete case3(n); 


// 转 到 下 述 情形 

} 

情形 3 N 的 父亲 、 兄 弟 结 点 S 和 S 的 儿子 都 是 黑色 的 。 

在 这 种 情况 下 ， 我 们 简单 地 S 为 红色 。 结 果 是 通过 S 的 所 有 路 径 ， 它 们 就 是 以 前 
不 通过 N 的 那些 路 径 ， 都 少 了 一 个 黑色 结 点 。 因 为 删除 N 的 初始 人 N 的 所 有 
路 径 少 了 一 个 黑色 结 点 。 但 是 ， 通 过 P 的 所 有 路 径 现 在 比 不 通过 P 的 路 径 少 了 一 个 黑色 结 
点 ， 所 以 仍 / 。 要 修正 这 个 问题 ， 我 们 要 从 情形 1 开始 ， 0 上 作 重 新 平衡 处 


见 
理 。 如 图 9.24 所 示 ， 其 相应 的 代码 见 算法 9.20。 












(a) 训 整 前 (b) 调整 后 
9.24、 红 黑 树 删除 后 的 情形 3 


算法 9.20 ” 红 黑 树 删除 后 的 情形 3 
Void delete case3(sttuet node *n) 
{ x 

struct node *gS = :sibling(n); r 

if (( ->parent- >color == BLACK) gots- >color == BLACK) &&(s->left->color 
BLACK) &&(s->right->color == BLACK)) { 
SEolor = RED; 

delete casel(n->parent); 
} else 

delete case4(n); 








// 转 到 下 述 情 形 
} 
情形 4 兄弟 结 点 S 和 S 的 儿子 都 是 黑色 ， 但 是 N 的 父亲 是 红色 。 

在 这 种 情况 下 , 我 们 简单 地 交换 N 的 兄弟 和 父亲 的 颜色 。 这 不 影响 不 通过 N 的 路 径 的 
黑色 结 点 的 数目 ， 但 是 它 在 通过 N 的 路 径 上 对 黑色 结 点 数目 增加 了 1， 添 补 了 在 这 些 路 径 
上 删除 的 黑色 结 点 。 如 图 9.25 所 示 ， 其 相应 的 代码 见 算法 9.21。 

算法 9.21 红 黑 树 删除 后 的 情形 4 

void delete case4(struct node *n) 

{ 














struct node *s=sibling(n); 
if ((n->parent->color == RED) &&(s->color == BLACK) &&(s->left->color 


== BLACK) &(s->right->color == BLACK)) { 
s->color = RED; 
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n->parent->color = BLACK; 


} else 
delete case5(n); // 转 到 下 述 情 形 
} 
(a) 训 整 前 (b) 调整 后 


图 9.25 ” 红 黑 树 删除 后 的 情形 4 
情形 5 兄弟 结 点 S 是 黑色 ，S 的 左 儿子 是 红色 ，S 的 右 儿 子 是 黑色 ， 而 N 是 它 父亲 
的 左 儿 子 。 
在 这 种 情况 下 ， 我 们 在 S 上 作 右 旋转 ， 这 样 S 的 左 儿子 成 为 S 的 父亲 和 的 新 兄弟 。 
接着 交换 S 和 它 的 新 父亲 的 颜色 。 所 有 路 径 仍 有 同样 数目 的 黑色 结 点 ， 但 是 现在 N 有 了 
个 右 儿 子 是 红色 的 黑色 兄弟 ， 所 以 进入 了 情形 6* N 和 它 的 父亲 都 不 受 这 个 变换 的 影响 。 
如 图 9.26 所 示 ， 其 相应 的 代码 见 算法 .9:22% 


oo 


(a) 调整 前 (b) 调整 后 
图 9.26 ” 红 黑 树 删除 后 的 情形 5 
算法 9.22” 红 黑 树 删除 后 的 情形 5 


void delete caseS(struct node *n 
{ 





struct node *s = sibling(n); 
if (s->color == BLACK) 
if ((n == n->parent->left) &&(s->right->color == BLACK) &&(s->left-> 
color == RED)) { 
s->color = RED; 
s->left->color = BLACK; 
rotate right(s); 
} else if ((n == n->parent->right) &&(s->left->color == BLACK,) 
&&(s->right->color == RED)) { 
s->color = RED; 





s->right->color = BLACK; 


rotate left(s); 
} 
delete case6(n); 


} 


// 转 到 下 述 情形 





情形 6 S 是 黑色 ，S 的 右 儿子 是 红色 ， 而 N 是 它 父亲 的 左 儿子 。 


在 这 种 情况 下 ， 我 们 在 N 的 父亲 上 作 左 旋转 ， 这 样 S 成 为 N 的 父亲 
使 S 的 右 儿子 为 黑 


父亲 。 接 着 交换 N 的 父亲 和 S 的 颜色 ,并 
所 以 没有 违反 性 质 3。 但 是 ，N 现在 增加 了 一 个 
黑色 ,要么 它 是 黑色 而 $S 被 增加 为 一 个 








色 祖 父 。 
结 点 。 i 如 果 一 个 路 径 不 通过 N， 则 有 两 种 可 能 性 。 





和 S 的 右 儿子 的 
色 。 子 树 在 它 的 根 上 的 仍 是 同 
祖先 ; 要 么 N 的 父亲 变 成 
所 以 ， 通 过 N 的 路 径 都 增加 了 一 个 黑色 






(1) 它 通 过 N 的 新 兄弟 。 那 么 它 以 前 和 现在 都 必定 通过 S 和 还 的 父亲 ， 而 它们 只 是 交 


换 了 颜色 。 所 以 路 径 保持 了 同样 数目 的 黑色 红 
S 的 右 儿 子 。 那 么 它 以 前 通过 Ss S 的 父亲 和 S 的 右 儿 子 ， 但 是 
的 颜色 ， 
色 结 结 j 点 


(2) 它 通过 N 的 新 叔父 ， 
现在 只 通过 S， 它 被 假定 为 它 以 前 的 父亲 
合成 效果 是 这 个 路 径 通 过 了 同样 数目 的 3 
在 图 9.27 中 ， 白 色 结 点 可 以 是 红色 或 












色 ， 














以 及 SS 的 右 儿子 ， 它 被 从 红色 改变 为 黑色 ， 
如 图 9.27 所 示 ， 其 相应 的 代码 见 算法 9.23。 





但 是 在 变换 前 后 都 必须 指定 相同 的 颜色 。 





(a) 调整 前 


(b) 调整 后 


图 9.27 红 黑 树 删除 后 的 情形 6 


算法 9.23” 红 黑 树 删除 后 的 情形 6 
void delete case6(struct node *n) 
{ 
struct node *s = sibling(n); 
s->color = n->parent->color; 
n->parent->color = BLACK; 
if (n == n->parent->left) { 
Ss->right->color = BLACK; 
rotate left(n->parent); 


} 
Slse 
s->left->color = BLACK; 
rotate right(n->parent); 
} 


// 父 结 点 左旋 


// 父 结 点 左旋 
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同样 地 ， 函 数 调用 都 使 用 了 尾部 递归 ， 所 以 算法 是 就 地 的 。 此 外 ， 在 旋转 之 后 不 再 作 
递归 调用 ， 所 以 进行 了 恒定 数目 (最 多 3 次 ) 的 旋转 。 
9.3.4 B- 树 

1.B- 树 的 定义 

前 面 介绍 的 查找 方法 ， 均 适用 于 查找 存储 在 内 存 中 的 数据 ， 统 称 为 内 查找 方法 ， 它 们 
适用 于 较 小 的 表 ， 而 对 较 大 的 、 存 储 在 外 存储 器 中 的 文件 就 不 合适 了 。 例 如 ， 当 用 平衡 二 
又 树 作为 磁盘 文件 的 索引 组 织 时 ， 若 以 结 点 作为 内 、 外 存 交 换 的 单位 ， 则 查找 到 需要 的 关 
键 字 之 前 ， 平 均 要 对 磁盘 进行 log, n 次 访问 。 因 为 读 / 写 磁盘 的 时 间 要 比 存 取 内 存 数据 大 得 
多 ， 这 么 多 次 读 盘 的 时 间 代 价 太 大 。 所 以 ， 必 须 找到 一 种 尽 可 能 降低 磁盘 IO 次 数 的 数据 
组 织 方式 。 磁 盘 等 外 部 设备 的 读 / 写 不 是 针对 一 个 字 节 而 是 针对 “页 ”的 。 例 如 ， 一 页 的 长 
度 通常 为 1024 或 2048 字 节 。 针 对 此 特点 ，1972 年 R. Bayer 和 下 ,M: MeCreight 提出 了 一 种 
称 之 为 B- 树 的 多 路 平衡 查找 树 。 这 是 一 种 适用 于 外 查找 方法 的 数据 结构 ， 它 适合 在 磁盘 等 
Se 

一 棵 m(m 之 3) 阶 的 B- 树 ， 或 者 为 空 树 ， 或 者 是 满足 如 下 条 件 的 m 叉 树 。 

(1) 树 中 每 个 非 终端 结 点 至 少 包 含 数据 项 (n, Ai Ki, Ab Kz, A2,…, Kn, As)。 其 中 ，n 为 
关键 字 总 数 ，K; (1<i<n) 是 关键 字 ，Ay 是 指向 子 树 根 结 点 的 指针 。 关 键 字 是 递增 有 序 的 ; 
Ki<Ks <…<K。， 且 A.(0<i<n) 所 和 树 中 所 有 结 点 的 关键 字 均 小 于 K,,， A, 所 指 子 树 
中 所 有 结 点 的 关键 字 均 大 于 Ks 实际 二 B- 树 的 每 个 结 点 还 应 包含 n 个 指向 关键 字 的 记录 的 指针 。 

(2) 所 有 叶子 结 点 都 在 树 的 同 汪 层 。 所 有 叶子 结 点 不 带 信 息 ， 可 以 看 作 外 部 结 点 或 查 
找 失败 的 结 点 ， 实 际 上 这 些 结 点 不 存在 ， 指 向 这 些 结 点 的 指针 为 空 。 

G) 每 个 非 根 结 点 中 包含 的 关键 字 个 数 n 满足 my/12]-1<n 太 上-1， 即 每 个 非 根 结 
点 至 少 应 有 [m/2] 个 关键 字 ， 至 多 有 mal 不 关键 字 。 因 为 每 个 内 部 结 点 的 度数 正好 是 关 
键 字 数 加 1， 浅 每 个 非 根 的 内 部 结 点 至 少 有 [my/2] 棵 子 树 ， 至 多 有 mm 棵 子 树 。 

(4) 如 果树 非 空 ， 则 根 至 少 有 1 个 关键 字 ， 如 果 根 不 是 叶子 结 点 ， 则 至 少 有 两 棵 子 树 。 
最 多 有 m-1 个 关键 字 ， 所 以 最 多 有 m 棵 子 树 。 

图 9.28 所 示 为 一 棵 4 阶 的 B- 树 。 
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二 


F 








2.B- 树 的 查找 
在 B- 树 中 查找 给 定 关键 字 的 方法 与 二 又 排 序 树 上 的 查找 类 似 , 不 同 的 是 每 个 结 点 上 确 
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(5)》 第 9 章 查找 
Oi ~ 人- De 
定向 下 查找 的 路 径 不 一 定 是 2 路 ， 而 最 多 可 能 是 m 路 的 。 因 为 结 点 内 的 关键 字 是 有 序 的 ， 
故 既 可 以 用 顺序 查找 ， 也 可 以 折 半 查找 。 若 在 某 结 点 内 找到 待 查找 的 关键 字 k， 则 查找 成 
功 ; 否则 可 确定 k 在 某 两 个 关键 字 之 间 ， 此 时 可 在 磁盘 中 读 入 相应 指针 所 指示 的 结 点 ， 继 续 
查找 。 若 找到 某 结 点 ， 则 查找 成 功 ， 或 直至 找到 叶子 结 点 ， 查 找 过 程 失败 。 
例如 ， 在 图 9.28 所 示 的 B- 树 中 查找 关键 字 42 的 过 程 如 下 : 首先 从 根 开 始 ， 根 据 根 结 
点 指针 t 找到 a 结 点 ， 因 给 定 的 值 42 大 于 关键 字 32， 如 果 给 定 值 存在 则 必 在 指针 A 所 指 
的 子 树 内 ， 顺 时 针 找 到 结 点 ， 因 42 小 于 64， 大 于 40， 则 顺 指针 找到 g 结 点 ， 在 该 结 点 
查找 到 关键 字 42， 查 找 成 功 。 查 找 失 败 的 过 程 也 类 似 。 例 如 ， 在 此 B- 树 中 查找 23， 
从 根 开始 ， 因 23 小 于 32， 则 顺 根 结 点 中 指针 Au 找到 b 结 点 ， 又 因为 b 结 点 中 只 有 一 个 关 
键 字 16， 且 23 大 于 16， 所 以 顺 该 结 点 中 第 2 个 指针 A 找到 e 结 点 ， 因 23 小 于 28， 则 顺 
指针 往 下 找 ， 此 时 因 指 针 所 指 为 叶子 结 点 ， 说 明 此 B- 人 23， 查 找 失败 。 
B- 树 的 存储 结构 可 描述 如 下 : 





















































































































































typedef struct BTNode{ 


int keynum; // 结 点 x a 即 结 点 的 大 小 
struct BTNode *parent; Wt 
struct Node 量 的 类 型 
{ int key; 好 字 向 量 

struct BTNode *ptr; 4 We 

int recptr; NF- // 记 录 指 针 向 量 
}node [m+1]; WN //key, 的 0 号 单元 末 用 

}BTNode, *BTree; ~ 、V 多 的 类 型 
i 总 


typedef struct{ 人 一 
Mone 3% > iene 
“~ < /71~m， 在 结 点 中 的 关键 字 序号 
mei /1 表示 查找 成 功 ，0 表示 查找 失败 
}Result; //B 树 的 查找 结果 类 型 
在 m 阶 B 树 T 上 查找 关键 字 key 的 过 程 代码 见 算法 9.24。 其 返回 结果 为 (pbitag)。 若 
查找 成 功 ， 则 特征 值 tag=1， 指 针 pt 所 指 结 点 中 第 i 个 关键 字 等 于 KK;， 否则 特征 值 tag=0， 
等 于 的 关键 字 应 插入 在 指针 Pt 所 指 结 点 中 第 i 个 和 第 过 1 个 关键 字 之 间 。 对 于 Search( ) 
函数 来 说 ， 其 功能 是 在 p->node[1...keynum].key 中 查找 i， 使 得 p->node[i].key 专 K 二 
p->node[it1].key。Pp 指向 待 查 结 点 ，q 指向 p 的 双亲 。 
算法 9.24 B- 树 的 查找 
int Search(BTree p, int K) 
{ 
int i=0,j; 
for(j=1;j<=p->keynum; j++) 
if(p->node [j] .key<=K) 
iej? 
return i; 
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3，B- 树 的 高 度 及 性 能 分 析 ， TI 
B- en 计算 时 间 这 两 部 分 构成 。B- 树 上 大 
部 分 基本 操作 所 需 访 问 盘 的 次 数 均 取决 慎 灶 高 6i。 关键 字 总 数 相同 的 情况 下 B- 树 的 高 度 越 
小 ， 磁 盘 IO 所 花 的 时 间 越 少 。 
与 高 速 的 CPU 计算 相 比 ， 磁 盘 IO 要 慢 得 多 ， 所 以 有 时 忽略 CPU 的 计算 时 间 ， 只 分 
析 算 法 所 需 的 磁盘 访问 次 数 (磁盘 访问 次 数 乘 以 一 次 读 写 盘 的 平均 时 间 ， 就 是 磁盘 IO 的 总 
时 间 ， 其 中 每 次 读 写 的 时 间 咯 有 差别 )。 
4，B- 树 的 高 度 
若 n>1，m>3， 则 对 任意 一 棵 具有 mn 个 关键 字 的 m 阶 B- 树 ， 其 树 高 h 至 多 为 
log((n+1)/2)+1 (9.6) 
这 里 ，t 是 每 个 (除根 外 ) 内 部 结 点 的 最 小 度数 ， 即 
t=[m/21 (9.7) 
由 上 述 定理 可 知 : B- 树 的 高 度 为 O(login)。 于 是 在 B- 树 上 查找 、 插 入 和 删除 的 读 写 盘 
的 次 数 为 O(logm)，CPU 计算 时 间 为 O(mlogm)。 


5. 性 能 分 析 


n 个 结 点 的 平衡 二 又 排序 树 的 高 度 H( 即 logn) 比 B- 树 的 高 度 h 约 大 logt 倍 。 若 m=1024， 
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则 logt=log512=9。 此 时 若 B- 树 高 度 为 4， 则 平衡 的 二 又 排序 树 的 高 度 约 为 36。 显 然 ， 若 
m 越 大 ， 则 B- 树 高 度 越 小 。 

对 于 内 存 中 的 查找 表 ,，B- 树 却 不 一 定 比 平衡 的 二 又 排序 树 好 , 尤其 当 m 较 大 时 更 是 如 
此 。 因 为 查找 等 操作 的 CPU 计算 时 间 在 B- 树 上 是 

O(mlogn)=O(logn(m/logt)) (9.8) 

而 m/logt>1， 所 以 m 较 大 时 O(mlogm) 比 平衡 的 二 又 排序 树 上 相应 操作 的 时 间 O(logn) 
大 得 多 。 

因此 ， 仅 在 内 存 中 使 用 的 B- 树 必须 取 较 小 的 m。 通 常 取 最 小 值 m=3， 此 时 B- 树 中 每 
个 内 部 结 点 可 以 有 2 或 3 个 孩子 ， 所 以 这 种 3 阶 的 B- 树 也 称 为 2-3 树 。 


























9.3.5 B+ 树 

B+ 树 是 针对 文件 系统 所 需 而 提出 的 一 种 B- 树 的 变形 树 。 了 B+ 树 和 m 阶 的 
B- 树 的 差异 在 于 : & 

(1) 有 n 标 子 树 的 结 点 中 含有 n 个 关键 字 。 > 

(2) 所 有 的 叶子 结 点 中 包含 了 全 部 关键 字 芯 指向 含 这 些 关键 字 记 录 的 指针 ， 


且 叶 子 结 点 本 身 依 关键 字 的 大 小 从 te 
(3) Re , 结 点 中 仅 含 其 子 树 ( 根 结 点 ) 中 的 最 大 (或 最 
小 ) 关 键 字 。 
对 电 + 谢 可 以 浊 科 册 太 宇 季 2 YY MA @ 从 根 结 点 开始 , 进 
行 随机 查找 。 X 
在 查找 时 ， 若 非 终 ad nme i 而 是 继续 向 下 直到 叶子 
结 点 。 因 此 ， 在 B+ 树 中 ， Vr SS 一 条 从 根 到 叶子 结 点 的 路 
径 。 其 余 同 人 


4 9.4 哈 希 查找 








9.4.1 ”了 哈 希 表 的 概念 


前 面 介绍 的 静态 查找 表 和 动态 查找 表 的 特点 是 为 了 从 查找 表 中 找到 关键 字 值 等 于 某 
个 值 的 记录 ， 都 要 经 过 一 系列 的 关键 字 比 较 ， 以 确定 待 查 记录 的 存储 位 置 或 查找 失败 ， 查 
找 所 需 时 间 总 是 与 比较 次 数 有 关 。 

如 果 将 记录 的 存储 位 置 与 它 的 关键 字 之 间 建 立 一 个 确定 的 关系 H， 使 每 个 关键 字 和 一 
个 唯一 的 存储 位 置 对 应 ， 在 查找 时 ， 只 需要 根据 对 应 关系 计算 出 给 定 的 关键 字 值 k 对 应 的 
值 H(K), 就 可 以 得 到 记录 的 存储 位 置 , 这 就 是 本 节 将 要 介绍 的 哈 希 表 查 找 方法 的 基本 思想 。 

我 们 将 记录 的 关键 字 值 与 记录 的 存储 位 置 对 应 起 来 的 关系 H 称 为 哈 希 函数 ，H(O 的 结 
果 称 为 哈 希 地 址 。 

根据 哈 希 函数 建立 的 表 称 为 哈 希 表 ， 其 基本 思想 是 以 记录 的 关键 字 值 为 自 变量 ， 根 据 
哈 希 函数 ， 计 算出 对 应 的 哈 希 地 址 ， 并 在 此 存储 该 记录 的 内 容 。 当 对 记录 进行 查找 时 ， 再 
根据 给 定 的 关键 字 值 ， 用 同一 个 哈 希 函数 计算 出 给 定 关键 字 值 对 应 的 存储 地 址 ， 随 后 进行 
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访问 。 所 以 哈 希 表 既 是 一 种 存储 形式 ， 又 是 一 种 查找 方法 ， 通 常 将 这 种 查找 方法 称 为 哈 希 
查找 。 

有 时 可 能 会 出 现 不 同 的 关键 字 值 的 哈 希 函数 计算 的 哈 希 地 址 相同 的 情况 ， 然 而 同一 个 
存储 位 置 不 可 能 存储 两 个 记录 ， 我 们 将 这 种 情况 称 为 冲突 ， 具 有 相同 函数 值 的 关键 字 值 称 
为 同义词 , 由 同义词 引起 的 冲突 称 为 同义词 冲突 。 在 实际 应 用 中 冲突 是 不 可 能 完全 避免 的 ， 
人 们 通过 实践 总 结 出 了 多 种 减少 冲突 及 解决 冲突 的 方法 。 


9.4.2 ” 哈 希 函数 的 构造 





建立 哈 希 表 ， 关 键 是 构造 哈 希 函数 。 其 原则 是 尽 可 能 地 使 任意 一 组 关键 字 的 哈 希 地 址 
均匀 地 分 布 在 整个 地 址 空间 中 ， 即 用 任意 关键 字 作 为 哈 希 函数 的 自 变 量 ， 其 计算 结果 随机 
分 布 ， 以 便 减 少 冲突 的 发 生 可 能 性 。 

常用 的 哈 希 函数 的 构造 方法 有 以 下 6 种 。 

1. 直接 定 址 法 

取 关 键 字 或 关键 字 的 某 个 线性 函数 为 哈 希 地 址 ， 即 

H(key)=key 或 H(Key)=a*key+b (9.9) 
其 中 ，a，b 为 常数 ， 调 整 a 与 b 的 值 可 以 使 哈 希 地 址 的 取 值 范围 与 存储 空间 范围 一 致 。 

如 果 现 在 要 制作 0 一 100 岁 的 人 日 数字 统计 表 ， 如 表 9-1 所 示 ， 那 么 对 年 龄 这 个 关键 

字 就 可 以 直接 用 年 龄 的 数字 作为 地 址 。 此 时 H(key)=key。 
表 9-1 人 口 统计 表 
































地 址 人 数 
00 50 
01 60 
02 40 
20 70 


如 果 我 们 要 统计 1980 年 后 出 生年 份 的 人 口 数 ， 如 表 9-2 所 示 ， 那 么 对 出 生年 份 这 个 
关键 字 可 以 用 年 份 减 去 1980 来 作为 地 址 。 此 时 H(key)= key-1980。 
表 9-2 人 口 统计 表 























地 址 人 数 
00 80 
01 100 
02 90 
20 110 








这 样 的 哈 希 函数 的 优点 是 简单 、 均 匀 ， 也 不 会 产生 冲突 ， 但 问题 是 需要 
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字 的 分 布 情况 ， 适 合 查找 较 小 且 连 续 的 情况 。 由 于 这 样 的 限制 ， 在 现在 应 用 中 ， 此 方法 昌 
然 简单 ， 但 并 不 常用 。 
2.， 除 留 余数 法 
取 关 键 字 被 某 个 不 大 于 哈 希 表 表 长 m 的 p 整除 后 所 得 余数 为 哈 希 地 址 ， 即 
H(key)=key%p (p 三 m， 设 其 中 m 为 哈 希 表 表 长 ) (9.10) 
质数 取 余 法 计算 简单 ， 适 用 范围 大 ， 但 是 整数 p 的 选择 很 重要 ， 如 果 选 择 不 当 ， 会 产 
生 较 多 同义词 ， 使 哈 希 表 中 有 较 多 的 冲突。 
例如 ， 表 9-3， 对 12 个 记录 的 关键 字 构 造 哈 希 表 时 ， 就 用 了 H(key)=key%12 的 方法 ， 
如 31%12=7， 所 以 它 存储 在 下 标 为 7 的 位 置 。 
表 9-3 ” 险 希 表 YA 
请 To rT TT T+ TT TT To 
x | | | |w | | 7 | | I | wo| 
不 过 这 也 有 产生 冲突 的 可 能 ， 如 果 关 键 字 中 有 像 16， 40，52，64 等 数字 ， 它 们 的 余 
数 都 是 4， 这 就 和 28 所 对 应 的 下 标 位 置 冲突 AN 
理论 研究 表明 ，p 应 取 不 大 于 m 的 素数 时 果 最 好 。 
3， 平 方 取 中 法 RN 
取 关 键 字 平 方 后 的 中 间 几 位 为 论 项 地 直 。 由 于 平方 后 的 中 间 几 位 数 与 原 关键 字 的 每 一 
位 数字 都 相关 ， 只 要 原 关键 字 的 分 布 是 随机 的 ， 以 平 廊 后 的 中 间 几 位 数 作为 哈 希 地 址 一 定 
也 是 随机 分 布 的 。 假 设 关键 字 是 1325， 那 么 它 的 平方 是 1755625， 再 抽取 中 间 的 3 位 ， 即 
556， 作 为 哈 希 地 址 。 再 如 ， 关 键 字 是 52135_ 那 它 的 平方 就 是 27175369， 抽 取 中 间 数 字 
175， 也 可 以 是 753; 作为 哈 希 地 址 。 平 方 到 息 法 比较 适合 不 知道 关键 字 的 分 布 ， 而 位 数 又 
不 是 很 大 的 情况 :一 
4. 折 司法 


把 关键 字 折 又 成 位 数 相 同 的 几 部 分 (最 后 一 部 分 的 位 数 可 以 不 同 )， 然 后 取 这 儿 部 分 的 
全 加 ( 舍 去 进位 ) 作 为 哈 希 地 址 ， 这 种 方法 称 为 折 闭 法 (folding)。 在 关键 字 位 数 较 多 ， 且 每 一 
位 上 数字 的 分 布 基 本 均匀 时 ， 采 用 折 和 县 法 ， 得 到 的 哈 希 地 址 比较 均匀 。 

例如 ， 关 键 字 是 3211253640， 哈 希 表 表 长 为 3 位 ， 我 们 将 它 分 为 4 组 ， 即 521 125 364 0， 
然后 合 加 求 和 521+125+364+0=1010， 再 求 后 3 位 得 到 哈 希 地 址 为 010。 有 时 可 能 不 能 保证 
分 布 均匀 , 不 妨 从 一 端 向 另 一 端 来 回 折 双 后 对 齐 求 和 。 例如, 将 521 和 364 反 转 , 再 与 125 
相 加 ， 变 成 125+125+463+0=713， 此 时 哈 希 地 址 为 713。 

折 释 法 事先 不 需要 知道 关键 字 的 分 布 ， 适 合 关键 字 位 数 比较 多 的 情况 。 

5.， 随 机 数 法 

选择 一 个 随机 函数 ， 取 关键 字 的 随机 函数 值 作为 它 的 哈 希 地 址 ， 即 H(key)= 
random(key)， 其 中 random 为 随机 函数 。 通 常 ， 当 关键 字 长 度 不 等 时 采用 此 法 构造 哈 希 函 


数 较 恰当 。 
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6.， 数字 分 析 法 

该 方法 是 提取 关键 字 中 取 值 较 均 匀 的 数字 作为 哈 希 地 址 的 方法 。 它 适合 于 所 有 关键 字 
都 已 知 的 情况 ， 并 需要 对 关键 字 中 每 一 位 的 取 值 分 布 情况 进行 分 析 。 例 如 ， 有 一 组 关键 字 
为 {87q12@go2, B79s66h1, B77g15, B74 65} . 

通过 分 析 可 知 ， 每 个 关键 字 从 左 到 右 的 第 1，2，3 位 和 第 6 位 取 值 比较 集中 ， 不 宜 作 
为 哈 希 函数 ， 剩 余 的 4，5，7，8 位 取 值 比较 分 散 ， 可 根据 实际 需要 取 其 中 的 若干 位 作为 哈 
希 地 址 。 若 取 最 后 两 位 作为 哈 希 地 址 ， 则 哈 希 地 址 为 {2，71，15，75}。 

实际 工作 中 需 视 不 同 的 情况 采用 不 用 的 哈 希 函数 。 通 常 ， 考 虑 的 因素 有 以 下 几 种 。 

(1) 计算 哈 希 函数 所 需 时 间 ( 包 括 硬件 指令 的 因素 )。 

(2) 关键 字 的 长 度 。 

(3) 哈 希 表 的 大 小 。 


























(4) 关键 字 的 分 布 情况 。 ,人 

(5) 记录 的 查找 频率 。 < 
9.4.3 ”解决 冲突 的 方法 和 

在 哈 希 表 中 ， 虽 然 冲 突 很 难 避 免 人 可 能 性 却 有 大 有 小 。 这 主要 与 3 个 因 
素 有 关 。 

(1) 与 装填 因子 有 关 。 we 中 已 存 入 的 记录 数 n 与 哈 希 地 址 空间 大 小 m 
的 比值 ， 即 a=n/m 。a 越 小 ， 冲 突 的 可 能 性 就 越 小 ; a 越 大 (最 大 可 能 取 1)， 冲 突 的 可 能 


性 就 越 大 。 这 很 容易 理解 ， 人 的， 和 
记录 同 已 插入 记录 发 生 冲 突 的 可 能 性 就 越 小 ; 反之 5<u 越 大 ， 哈 希 表 中 的 空闲 单元 的 比例 
就 越 小 。 所 以 待 插入 记录 月 已 插入 记录 发 生 冲突 的 可 能 性 就 越 大 。 另外 ，a 越 小 ， 存 储 空 
间 的 利 友之， 存储 空间 的 利用 率 就 高 ?为 了 兼顾 减少 冲突 的 发 生 ， 又 兼顾 提高 
存储 空间 的 率 这 两 方面 通常 最 终 使 @ 控 制 在 0.6 一 0.9。 
ee 和 的 哈 希 函 数 有 关 。 若 哈 希 函 数 选择 得 当 ， 就 可 使 哈 希 地 址 尽 可 能 均匀 地 
分 布 在 哈 希 地 址 空间 中 ， 从 而 减少 冲突 的 发 生 ， 和 否则 ， 若 哈 希 函数 选择 不 当 ， 就 可 能 使 哈 
希 地 址 集中 于 某 些 区 域 ， 从 而 加 大 冲突 的 发 生 。 
G) 与 解决 冲突 的 哈 希 冲突 函数 有 关 。 哈 希 冲突 函数 的 选择 影响 减少 或 增加 发 生 冲 突 
的 可 能 性 。 
下 面 介绍 几 种 常用 的 解决 哈 希 冲突 的 方法 。 
， 开 放 定 址 法 
开放 定 址 法 是 一 类 以 发 生 冲 突 的 哈 希 地 址 为 自 变量 ， 通 过 某 种 哈 希 冲突 函数 得 到 一 个 
新 的 空闲 的 哈 希 地 址 的 方法 。 在 开放 定 址 法 中 ， 哈 希 表 的 空闲 单元 不 仅 允许 地 址 为 d 的 同 
义 词 关键 字 使 用 ， 而 且 允 许 发 生 冲突 的 其 他 关键 字 使 用 ， 因 为 这 些 关 键 字 的 哈 希 地 址 不 为 
回 章 贸 回 。 4， 所 以 称 为 非 同义词 关键 字 。 开 放 定 址 法 的 名 称 就 是 来 自 此 方法 的 哈 希 表 空闲 单元 
既 向 同义词 关键 字 开 放 ， 也 向 发 生 冲突 的 非 同义词 关键 字 开放 。 至 于 哈 希 表 的 一 个 
回 也 址 中 存放 的 是 同义词 关键 字 还 是 非 同义词 关键 字 ， 要 看 谁 先 占用 它 ， 这 和 构造 哈 
【参考 图 文 】 希 表 的 记录 排列 次 序 有 关 。 
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在 开放 定 址 法 中 ， 以 发 生 冲 突 的 哈 希 地 址 为 自 变量 ， 通 过 某 种 哈 希 冲 突 函数 得 到 一 个 
新 的 空闲 哈 希 地 址 的 方法 有 很 多 种 ， 相 关 的 数学 递 推 描述 公式 可 表述 为 
du =h(key) 
di=(du+Adi)%p (<i<p-)) 
其 中 ，h(key) 为 哈 希 函数 ，p 为 哈 希 表 长 ， Adi 为 增 量 序列 ， 可 以 有 3 种 取 法 : 

(1) 当 Adi=1，2，3，…，p-1l 时 ， 称 线性 探测 再 散 列 。 

(2) 当 Adi=1，-12，22，-22，32，…，+k(k 乏 p/12) 时 ， 称 二 次 探测 再 散 列 。 

(3) 当 Adi 为 伪 随 机 数 序列 时 ， 称 伪 随 机 探测 再 散 列 。 

对 于 线性 探查 法 来 说 ， 其 是 从 发 生 冲 突 的 地 址 ( 设 为 do) 开 始 ， 依 次 探查 do 的 下 一 个 地 
址 ( 当 到 达 下 标 为 m-1 的 哈 希 表 表 尾 时 ， 下 一 个 探查 的 地 址 是 表 首 地 址 0)， 直 到 找到 一 个 
空闲 单元 为 止 ( 当 哈 希 表 没 有 满 时 就 一 定 能 找到 一 个 空闲 单元 )。 3 

线性 探查 法 容易 产生 堆积 问题 。 这 是 由 于 当 连 续 出 现 若 人 
占用 单元 d， 这 连续 的 若干 个 同义词 将 占用 哈 希 表 的 d， 
些 关键 字 并 没有 同义词 。 有 六 

例如 ， 在 长 度 等 于 11 的 哈 希 表 中 已 填 有 关键 字 为 17,60,29 的 记录 (图 9.29)， 令 
h(key)=key %11。 现 有 第 四 个 记录 ， 其 关键 字 为 38， 由 哈 希 函数 得 到 哈 希 地 址 为 5， 产 
生 冲突 。 当 用 线性 探测 再 散 列 的 方法 处 an 6， 仍 冲突 ， 再 求 下 一 个 地 
址 7， 仍 冲突 ， 直 到 哈 希 地 址 为 8. 的 位 置 为 “ 空 ”为 止 ， 处 理 冲 突 的 过 程 结束 ， 记 录 填 入 
哈 希 表 中 序号 为 8 的 位 置 。 当 用 三 次 测 再 散 列 的 方法 处 理 时 ， 则 应 该 填 入 序号 为 4 的 位 
乱 。 类 似 地 可 得 到 伪 随 机 青 散 列 的 地 址 (图 929)。,， ,7 全 


了 
0 一 > 3 4 2 6 7 8 9 10 


二 eo > | 2 


XX >/ () 晰 入 前 
60 |17|29 | 38 


(b) 线性 探测 得 散 列 


38 60 人 29 


(©) 二 次 探测 目 散 列 





(9.11) 








全 等 单元 )， 此 时 ， 随 后 的 这 
























































38 | 60 17 29 








(d) 伪 随 机 探测 洒 散 齐 
9.29 用 开放 定 址 处 理 冲突 时 ， 关 键 字 为 38 的 记录 插入 前 后 的 哈 希 表 
另外 ， 平 方 探查 法 是 一 种 较 好 的 处 理 冲突 的 方法 ， 可 以 避免 出 现 堆 积 问 题 。 它 的 缺点 
是 不 能 探查 到 哈 希 表 中 的 所 有 单元 ， 但 至 少 能 探查 到 一 半 单 元 。 
为 了 使 大 家 更 充分 地 理解 开放 地 址 法 ， 下 面 再 举 一 个 例子 说 明 。 
假设 哈 希 表 长 度 m=13， 采 用 除 留 余数 法 和 线性 探查 法 建立 如 下 关键 字 集合 的 哈 希 表 ; 


(17,21,42,31,53,72,47,88,15,55,76)。 





下 标 


本本 


数 所 结构 与 算法 应 用 实践 教程 第 版 人 了 


解 : n=11，m=13， 除 留 余数 法 的 哈 希 函数 为 h(key)=key%p ，p 应 小 于 等 于 
假设 p 取 值 为 13， 当 出 现 同义词 问题 时 采用 线性 探查 法 解决 冲突 
hal0... 


12]， 见 表 9-4。 
h(17)=4， 没 有 冲突 ， 
h(21)=8， 没 有 冲突 ， 
h(42) =3， 没 有 冲突 ， 





将 17 放 在 ha[4] 处 。 


将 21 放 在 ha[8] 处 。 
将 42 放 在 ha[3] 处 。 


h(31)=5， 没 有 冲突 ， 将 31 放 在 ha[5] 处 。 
h(53)=1， 没 有 冲突 ， 将 53 放 在 ha[1] 处 。 


h(72)=7 ， 没 有 冲突 ， 
h(47)=8， 有 冲突 


do =8, di =(8+1)%13=9， 冲 突 已 解决 ， 将 47 放 在 ha[9] 处 。 


h(88)=10， 没 有 冲突 ， 
h(15)=2， 没 有 冲突 ， 
h(55)=3 ， 有 冲突 。 


将 72 放 在 ha[7] 处 。 


将 88 放 在 ha[10] 处 。 





将 15 放 在 ha[2] 处 。 


do=3, di=(3+1)%13=4， 仍 有 冲突 。 
d =(4+1%13=5 ， 仍 有 冲突 。 本 
d =(5+1)%13=6 ， 冲 突 已 解决 ， 将 53 放 在 bargj 处 。 


h(76)=11， 没 有 冲突 


， 将 76 放 在 hafll] 处 。 


` 表 9-4 哈 希 表 ha[0..12] 





m 的 素数 ， 
:， 则 建立 的 哈 希 表 


oT vr ToT 






探查 次 数 国 洒 本 本 看 而 本 而 本 机 本 针 区 贡 本 机 本 而 本 贡 本 机 本 机 


和 拉链 法 
拉链 法 是 把 所 有 


放 的 不 再 是 记录 本 身 ， 


多 空间 ， 
节省 空间 。 





通常 a=1。 
与 开放 地 址 法 相 
(D) 








(2) 











(3) 开放 地 址 法 中 ， 




















(4) 在 | 








而 对 开 


此 ， 拉 链 法 有 如 下 几 个 优点 : 

拉链 法 处 理 冲 突 简 单 ， 且 无 堆积 现象 ， 既 非 同义词 绝 不 会 发 生 冲突 ， 
找 长 度 较 短 。 
于 拉链 法 中 各 链表 上 的 记录 空间 是 动态 
表 长 的 情况 。 
为 减少 冲突 要 求 填 装 因子 a 较 小 ， 
而 拉链 法 中 可 取 a 宇 1， 且 记录 较 大 时 ,拉链 法 中 增加 的 指针 域 可 忽略 不 计 ， 因 此 








同义词 用 单 链表 连接 起 来 的 方法 。 这 种 方法 中 ， 

而 是 相同 同义词 单 链表 的 头 指针 。 
点 ， 所 以 此 时 填 装 因子 a 根据 同义词 的 多 少 既 可 以 设 定 为 大 于 1， 
手册 


哈 希 表 每 个 单元 中 存 


由 于 单 链表 中 可 插入 任意 多 个 结 


也 可 以 设 定 为 小 于 或 等 


因此 平均 查 





拉链 法 构造 的 哈 希 表 中 ， 删 除 记 录 的 操作 易于 实现 ， 
表 中 相应 的 记录 即 可 ， 


故 当 数据 规模 较 大 时 会 


请 的 ， 故 它 更 适合 于 造 表 前 无 法 确定 


浪费 很 





只 要 简单 地 删 去 链 


放 地 址 法 构造 的 哈 希 表 ， 删 除 记 录 不 能 简单 地 将 被 删 记 


O 有 8 





录 的 空间 和 置 为 空 ， 否 则 将 截断 在 它 之 后 填 入 哈 希 表 的 同义词 记录 的 查找 路 径 ， 这 是 因 
为 各 种 开放 地 址 法 中 ， 空 地 址 单元 (及 开放 地 址 ) 都 是 查找 失败 的 条 件 。 因 此 在 开放 地 
址 法 处 理 冲突 的 哈 希 表 上 执行 删除 操作 ， 只 能 在 被 删除 记录 上 作 删 除 标记 ， 而 不 能 真 
正 删除 记录 。 

拉链 法 亦 有 缺点 : 指针 需要 额外 的 空间 ， 故 当 记 录 规 模 较 小 时 ， 开 放 地 址 法 较为 节省 
空间 ， 而 若 将 节省 的 指针 空间 用 来 扩大 哈 希 表 的 规模 ， 可 使 填 装 因子 变 小 ， 这 又 减少 了 
放 定 址 法 中 的 冲突 ， 从 而 提高 平均 查找 速度 。 

假设 哈 希 表 长 度 m=13， 采 用 除 留 余数 法 加 拉链 法 建立 如 下 关键 字 集 合 的 哈 希 表 
(17,21,42,31,53,72,47,88,15,55,76)。 

解 : n=11，m=13， 除 留 余数 算法 的 哈 希 函数 为 H(key)=key % p。p 应 为 小 于 等 于 m 的 
| HDs 












































h(76)=11 。 RS 
最 后 建立 的 链表 如 图 9.30 所 示 。 ; WS 
下 标 ” 哈 希 表 oo 
























































8 47 一 人 一”| 21 入 
9 入 

10 88 | 入 

11 76 | ^ 

12 入 


图 9.30 ”采用 拉链 法 解决 冲突 时 建立 的 链表 


3 再 哈 希 法 

当 发 生 冲 突 时 ， 用 另 一 个 哈 希 函数 再 计算 另 一 个 哈 希 地址 ， 如 果 再 发 生 冲 突 ， 再 
使 用 另 一 个 哈 希 函数 ， 直 至 不 发 生 冲 突 为 止 。 这 种 方法 要 求 预先 要 设置 一 个 哈 希 函 数 
的 序列 。 
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4.， 溢出 区 法 
除 基本 的 存储 区 外 ( 称 为 基本 表 ), 另外 建立 一 个 公共 溢出 区 ( 称 为 游 出 表 )， 当 发 生 冲 突 
时 ， 记 录 可 以 存 入 这 个 公共 溢出 区 。 


9.4.4 查找 及 分 析 


哈 希 表 的 查找 过 程 与 哈 希 表 的 构造 过 程 基本 一 致 。 对 于 给 定 的 关键 字 值 key， 按 照 建 
表 时 设 定 的 哈 希 函数 求 得 哈 希 地 址 ， 若 该 地 址 所 指 位 置 已 有 记录 ， 并 且 其 关键 字 值 不 等 于 
给 定 值 key， 则 根据 建 表 时 设 定 的 冲突 处 理 方法 求 得 同义词 的 下 一 地 址 ， 直 到 求 得 的 哈 希 
地 址 所 指 位 置 为 空闲 或 其 中 记录 的 关键 字 值 等 于 给 定 值 key 为 止 。 如 果 求 得 的 哈 希 地 址 对 
应 的 内 存 空间 为 室 闲 ， 则 查找 失败 ， 如 果 求 得 的 哈 希 地 址 对 应 的 内 存 空间 中 的 记录 关键 字 
值 等 于 给 定 值 key， 则 查找 成 功 。 

上 述 查找 过 程 可 以 描述 如 下 : -人 

(0 计算 出 给 定 关键 字 值 对 应 的 哈 希 地 址 addr=H(ke CK 

(2) 若 满 足 条 件 while( (addr 中 不 字 )&&eddr ， !=key))， 则 按 冲 突 处 理 方法 
求 得 下 一 地 址 addr。 a 

G) 如 果 addr 中 为 空 ， 则 查找 失败 ， 返 | Wi 否则 查找 成 功 ， 并 返回 地 址 addr。 

哈 希 表 查 找 相应 的 代码 见 算法 9.25 
算法 9.25 ” 哈 希 表 的 查找 NS 








void InsertHash(HashTable *H,int key){ 
int addr = Hash(key); 
while (H->elem[addr] != NULLKEY) { 


addr = (addr+1) % m; // 开 放 定 址 法 的 线性 探测 


H->elem[addr] = key; 
} 


// 散 列表 查找 关键 字 

int SearchHash(HashTable H,int key,int *addr) { 
*addr = Hash(key); 
while(H.elem[*addr] != key) { 


*addr = (*addr+1) % m; // 开 放 定 址 法 
if (H.elem[*addr] == NULLKEY || *addr == RK 


return UNSUCCESS; “< 
} 


3 

return SUCCESS; XY, 
f 

<A 


9.5 应 用 :实践 


9.5.1 直方 图 问题 


NAN 


直方 图 问题 是 指 ， 从 二 个 具有 n 个 关键 字 的 集合 开始 ， 要 求 输出 不 同 关键 字 的 列表 以 
及 每 个 关键 字 在 集合 中 出 现 的 次 数 (频率 )。 下 面 给 出 含有 10 个 关键 字 的 例子 ， 其 中 关键 字 


[2,4,2,2,3,4,2,6,4,2] 作 为 直方 图 的 输入 ， 其 表格 形式 见 表 9-5。 
表 9-5 直方 图 的 表格 形式 





关键 字 频率 
2 5 
3 1 
4 3 
6 1 

















直方 图 一 般 用 来 确定 数据 的 分 布 。 例 如 ， 图 像 中 的 灰色 比例 、 考 试 的 分 数 、 居 住 在 某 
城市 的 人 所 获得 的 最 高 学 位 等 ， 都 可 以 用 直方 图 来 表示 。 当 关键 字 为 0~r 范围 内 的 整数 ， 
且 上 的 值 足够 小 时 ， 可 以 在 线性 时 间 内 ， 用 一 个 相对 简单 的 过 程 ( 见 下 面 的 程序 ) 产 生 直方 









































图 。 在 该 过 程 中 , 用 数组 元 素 h[] 代 表 关 键 字 i 的 频率 , 可 以 使 / 











射 到 这 个 范围 中 。 例 如 ， 如 果 关 键 字 是 小 写字 母 ， 则 可 以 用 映 身 
解 : 
#include "stdio.h" 


#include "stdlib.h" 
void main(void) 


程序 把 其 他 关键 值 类 型 映 





[ybyes™,2] [0, 125]s 


oy 
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9.5.2 ”箱子 装载 问题 


求 将 n 个 物品 装 入 到 容量 为 c 的 箱子 中 的 最 优 匹配 方法 。 通 过 使 用 平衡 的 搜索 树 ， 能 
够 在 O(nlog,n) 时 间 内 完成 箱子 装载 过 程 。 搜 索 树 的 每 一 个 元 素 代表 一 个 正在 使 用 的 并 且 
还 能 继续 存放 物品 的 箱子 。 假 设 当 物 品 i 被 装载 时 ， 已 使 用 的 9 个 箱子 还 有 一 些 剩余 空 间 ， 
设 这 些 箱子 的 剩余 容量 分 别 为 1、3、12、6、8、1、20、6 和 5。 可 以 用 一 棵 二 又 搜索 树 来 
存储 这 9 个 箱子 ， 每 个 箱子 的 剩余 容量 作为 结 点 的 关键 值 。 因 此 ， 这 棵 树 应 是 允许 有 重复 
值 的 二 又 搜索 树 。 

图 9.31 所 示 给 出 了 存储 上 述 9 个 箱子 的 二 又 搜索 树 。 结 点 关键 值 是 箱子 的 剩余 容量 ， 
结 点 外 侧 是 箱子 的 名 称 ， 这 棵 树 也 是 一 棵 AVL 树 。 如 果 需 要 装载 的 物品 i 需要 s[i]=4 个 空 
间 单 量 是 6， 由 于 物体 i 可 以 放 入 该 箱 中 ， 因 此 ， 箱 子 h 成 为 一 个 候选 。 由 于 根 结 点 右 子 
树 中 所 有 箱子 的 剩余 容量 至 少 是 6， 故 不 需要 再 从 右 子 树 中 寻找 合适 的 箱子 ， 只 需要 从 左 


@r 


子 树 中 寻找 。 箱 子 b 的 容量 不 能 容纳 该 物品 。 因 此 ， 搜 索 转移 到 了 箱子 b 的 右 子 树 中 ， 右 
子 树 的 根 结 点 箱子 i 可 以 容纳 该 物品 ， 所 以 箱子 i 成 为 适合 的 候选 。 此 外 ， 把 搜寻 转移 到 
箱子 i 的 左 子 树 ， 由 于 左 子 树 为 空 ， 因 此 不 再 有 更 好 的 候选 ， 所 以 箱子 i 即 要 找 的 箱子 。 





CD (3) A 
图 9.31 存储 9 个 条 了 的 二 双 扫 过 机 人 


当 找 到 合适 的 箱子 后 ， 可 以 将 它 从 搜索 树 中 删除 ,< 特 并 币 余 容量 去 Ss[ 计 ， 再 将 它 重 
新 插入 到 树 中 (除非 它 的 剩余 容量 为 零 )。 站 则 可 以 用 一 个 新 的 箱 
子 来 装载 物品 i。 

为 了 实现 上 述 思想 ， 既 既 可 以 采用 二 叉 搜 电 可 以 采用 AVL 搜索 树 。 无 论 哪 一 种 方 
法 ， 都 需要 使 用 函数 FindGE(k Kout, 数 可 以 找到 剩余 容量 Kout>k 的 具有 最 小 
剩余 容量 的 箱子 。 具体 实现 代码 见 

解 : Ey ~ AM 








aa 
一 一 


p = p->rchild; 
.: 


if (18) 
return 0; // 没 找到 
Kout = s->key; 
return 1; 
本 章 小 结 


本 章 讨论 查找 表 的 各 种 表示 方法 以 及 查找 效率 的 衡量 标准 一 平均 查找 长 度 。 查 找 表 
即 为 集合 结构 ， 表 中 记录 之 间 本 不 存在 约束 条 件 ， 但 为 了 提高 查找 速度 ， 在 计算 机 中 构建 
查找 表 时 ， 应 人 为 地 在 记录 的 关键 字 之 间 加 上 某 些 约束 条 件 ， 即 以 其 他 结构 表示 。 由 于 碍 
各 中风 二 作 是 关外 比较 国 此 SA 找 所 需 进行 的 比较 次 数 
的 期 望 什 作 为 查找 方法 效率 的 衡量 标准 ， 称 之 为 平均 查找 长 度 。 

ee 
汶 刀 人 结 析 乌有 让 才 和 家 引 有 认 主要 用 于 表示 静态 查找 表 树 表 包 
括 静 态 查 找 树 、 二 又 查找 树 和 二 叉 平衡 树枝 家 和 哈 希 表 主 要 用 于 表示 动态 查找 表 。 
硒 找 树 的 特点 是 全 经 过 一 次 比较 全 将 维 续 查 找 的 范围 缩小 到 某 一 株 子 树 上， 但 查 拷 
机 六 不 人 限于 二 内。 以后 将 人世 式 的 坦 扫 > 

所 有 顺序 结构 的 表 和 查找 树 的 平均 查找 长 度 都 是 随 着 守 找 表 中 记录 数 的 增加 而 增 大 ， 
而 哈 希 表 的 于 均 碍 找 长 度 是 著 壤 园子 的 函数 。 因 此 省 可 能 设计 出 使 均 查 找 长 度 不 超过 
某 个 期 站 值 的 哈 希 表 。 一 Xx 放 

yy A | 上 \ 严 
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9.1 单 选 题 
1. 对 N 个 元 素 的 表 作 顺序 查找 时 ， 若 查找 每 个 元 素 的 概率 相同 ， 则 平均 查找 长 度 为 
( ). 
A. (N+1)/2 B. N/2 G; HN D. [(+N) NJ]/2 
2. 长 度 为 121 的 表 ， 采 用 分 块 查找 法 ， 每 块 的 最 佳 长 度 是 ( )。 
A. 12 B. 11 GB D. 10 
3. 在 下 列 各 种 查找 法 中 ， 平 均 查 找 长 度 与 结 点 个 数 n 无 关 的 查找 方法 是 ( 。“)。 
A. 散 列 查找 法 B. 顺序 查找 法 
C. 散 列 和 顺序 查找 法 D. 二 分 查找 法 
4. 高 度 为 8 的 平衡 二 又 树 的 结 点 数 至 少 有 ( “) 个 。 
A. 50 B. 51 C. 54 D. 56 


5. 下面 关 于 B- 树 和 B+ 树 的 叙述 中 ， 不 正确 的 是 (。”)。 
A. B- 树 和 B+ 树 都 是 平衡 的 多 又 树 
B. B- 树 和 B+ 树 都 可 用 于 文件 的 索引 结构 




















C. B- 树 和 B+ 树 都 能 有 效 地 支持 顺序 检索 
D. B- 树 和 B+ 树 都 能 有 效 地 支持 随机 检索 
9.2 填空 题 
1. 顺序 查找 n 个 元 素 的 顺序 表 ， 若 查找 成 功 ， 则 比较 关键 字 的 次 数 最 多 为 
次 ， 当 使 用 监视 哨 时 ， 若 查找 失败 ， 则 比较 关键 字 的 次 数 为 
2. 如 果 要 求 一 个 线性 表 既 能 较 快 查找 ， 又 能 适应 动态 变化 的 要 求 ， 可 以 采用 
查找 方法 。 
3. 用 折 半 法 查找 一 个 线性 表 时 ， 该 线性 表 必 须 具 有 的 特点 是 ; 而 分 块 查找 
法 要 求 将 待 查 找 的 表 均 匀 地 分 成 若干 块 且 块 中 诸 记 录 的 顺序 是 任意 的 ， 但 块 与 块 之 间 


















































4. 法 构造 的 哈 希 函数 肯定 不 会 发 生 冲突 。 





5. 散 列表 的 平均 查找 长 度 与 和 有 关 ,, “人 
9.3 思考 题 XX\ 
1， 解释 下 列 名 词 ™) 


(CD 查找 ，(2) 树 状 查找 (3) 哈 希 函数 ，(4) 神医 

2. 设 有 序 表 为 {a,b,c,d,e,f,g}， 请 分 别 画 出 对 给 定 古 f、g 和 h 进行 折 半 查找 的 过 程 。 

3. 有 一 个 2000 项 的 表 ， 并 问 : 

(1) 每 块 理想 长 度 是 多 少 ? \ 

CO) 分 成 多 少 块 最 为 理想 ? AR 二 

为 多 少 4 1 六 

(3) 平均 查找 长 度 为 多 少 37 、、 0 

(4) 若 每 块 是 20， 则 平均 查找 长 度 为 多 少 ? WL 

4. 输入 一 个 正 整 数 序列 440,28,6,72,100,3,54;1,80,91,38}， 建 立 一 个 二 叉 排序 树 ， 然 后 
删除 结 点 72， 分 别 画 出 该 二 又 树 及 删除 结 目 :72 后 的 二 又 树 。 

5. 线性 表 的 关键 字 集 合 为 {113,12,180;138,92,67,94,134,252,6,70,323,60}, 共有 13 个 元 
素 ， 己 知 哈 希 函数 为 h(k) =k mod 13， 采 用 链接 表 处 理 冲 突 ， 试 设计 这 种 链表 结构 。 

6. 散 列表 存储 的 基本 思想 是 什么 ? 解决 碰撞 的 基本 方法 有 哪些 ? 

7. 设 有 一 组 关键 字 {9,01,23,14,55,20,84,27}， 采 用 哈 希 函数 H(key)=key mod 7， 表 长 
为 10， 用 开放 地 址 法 的 二 次 探测 再 散 列 方法 H=(H(key)+di) mod 10(d= 士 12， 士 22， 士 32… 
土 k”)(k 志 5) 解 决 冲突 。 要 求 : 对 该 关键 字 序 列 构造 哈 希 表 ， 并 计算 查找 成 功 的 平均 查 
找 长 度 。 

8. 对 于 关键 字 集 {30,15,21,40,25,26,36,37}， 若 查找 表 的 装填 因子 为 0.8， 采 用 线性 探 
测 再 散 列 方法 解决 冲突 ， 要 求 : 

(1) 设计 哈 希 函数 ， 

(2) 画 出 哈 希 表 ; 

(3) 计算 查找 成 功 和 查找 失败 的 平均 查找 长 度 ; 

(4) 写 出 将 哈 希 表 中 某 个 数据 元 素 删 除 的 算法 。 

9. 根据 哈 希 表 的 构造 过 程 和 查找 过 程 ， 写 出 开放 地 址 法 的 一 般 形式 的 函数 表示 算法 。 

10. 试 给 出 一 棵 树 最 少 的 关键 字 序 列 , 使 AVL 树 的 4 种 调整 平衡 操作 各 至 少 一 次 ,并 
画 出 其 构造 过 程 。 
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11. 对 给 定 的 数列 R={7,16,4,8,20,9,6,18,5}， 构 造 一 棵 二 又 排序 树 ， 并 要 求 : 
(D 给 出 按 中 序 遍历 得 到 的 数列 R1; 


(2) 给 出 按 后 序 遍 历 得 到 的 数列 R2。 
12. 设 有 3 阶 B- 树 ， 如 图 9.32 所 示 。 





图 9.32 3 阶 B- 树 SA 


(1) 在 该 B- 树 上 依次 插入 关键 字 33、97， 入 后 的 B- 树 ， 
(2) 从 (1) 得 到 的 B- 树 上 依次 删除 66、 了 次 删除 后 的 B- 树 。 


CC 


A ~ 


因数 据 结构 的 相关 
关内 容 ， 特 提供 关键 字 索 
码 ， 其 他 内 容 提供 所 在 的 3 








AOE 网 (Activity On Edge network) 
AOV 网 (Activity On Vertex network 
B+ 树 

B- 树 

边 (edge) 

层 、 层 次 (level) 

插入 排序 (insertion sort) 

查找 (searching) 

查找 树 (table) 

冲突 (collision) 
抽象 数据 类 型 (abstract data type) 
稠密 图 (dense graph) 

出 度 (out-degree) 

除 法 (division method) 

串 (string) 

次 关键 字 (second key) 

存储 结构 (storage structure) 
存储 密度 (storage density) 

带 权 路 径 长 度 (weighted path length) 
单 链表 (singly linked list) 


等 价 关 系 (equivalence relation) 
等 价 类 (equivalence class) 

递归 函数 (recursive function) 
顶点 (vertex) 

动态 查找 表 (dynamic search table) 


关键 词 索 引 


念 、 技 术 和 思想 等 内 容 太 过 复杂 ， 为 了 方便 读 
引 。 本 索引 按照 ; 


页 码 。、 





3 川 相关 





度 (degree) 
) 堆 (heap) 








推 排序 (heap sorting) 


队列 (queue) 
队 头 (front) 
队 尾 (rean) 


-又 查找 树 (binary search tree) 
- 突 排 序 树 (binary sort tree) 


二 义 树 (binary tree) 


次 探测 (quadratic probing) 
分 块 查找 (blocking search) 


高 度 (height) 


关键 路 径 (critical path) 


关键 字 (key) 


广度 优先 搜索 (breadth first search) 


归并 排序 (merge sort) 
哈 夫 曼 编码 (Huffman code) 
哈 夫 曼 树 (Huffman tree) 


哈 希 表 (Hash table) 


哈 希 查找 (Hash search) 
哈 希 地 址 (Hash address) 
哈 希 函数 (Hash function) 


孩子 (children) 


后 进 先 出 (Last In First Out，LIFO) 


后 序 遍 历 (postorder traversal) 


者 迅速 查找 定位 相 
念 通常 提供 
重要 内 容 页 码 可 能 不 止 寺 处 。 


念 定义 的 页 
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弧 (arc) 三 元 组 表 (list of 3-tuples) 
基数 排序 (radix sort) 森林 (forest) 
简单 选择 排序 (simple selection sort) 深度 (depth) 
静态 查找 表 (static search table) 深度 优先 搜索 (depth first search) 
静态 链表 (implementing linked using 生成 树 (spanning tree) 
人 de) 生成 森林 (spanning forest) 
十 字 链 表 (orthogonal list) 
时 间 复 杂 度 (time complexity) 
树 (tree) 
树 的 遍历 (traversal oftree) 


开放 地 址 (open addressing) 
空 串 (null string) 

空格 串 (blank string) 

空间 复杂 度 (space complexity) 


pg 时 的 后 序 遍 历 (pos r traversal 
连通 分 量 (connected component) 树 的 后 序 遍 历 (posterdar traversal) 


树 的 先 序 遍 历 (preorder traversal) 
数据 (data) 
| 数据 对 象 (data object) 
数据 结构 (data structure) 
数据 类 型 (data type) 
数据 项 (data item) 
数据 元 素 (data element) 
数组 (arrays) ~ 
双亲 (parents) 
双向 链表 (doubly linked list) 
顺序 (存储 结构 )(sequentiaD) 
顺序 查找 (squential search) 
雪 表 (inverse adjacent list) 算法 algorithm) 
随机 数 法 (random) 


排序 (sorting) - 
缩小 增 量 排序 (diminishing increment 
判定 树 (decision tree) i 


频 度 (frequency count) 索引 顺序 查找 (indexed sequential 
search) 


连通 图 (connected graph) 
链表 (linked list) 

链 式 (存储 结构 )(linked) 
链 式 基数 排序 (linked radix sort) 
邻接 表 (adjacent list) 

邻接 点 (adjacent) 

邻接 矩阵 (adjacent matrix) 
逻辑 结构 (logical structure ) 
满 二 叉 树 (full binary tree) 
冒 泡 排序 (bubble sort) 
模式 匹配 (pattern matehing) 


内 部 排序 (internal'sort) 


平方 取 中 法 (mid-square method) 
2 衡 二 又 树 (balanced binary tree) 
平衡 树 (balanced tree) 
平衡 旋转 (balance rotation) 

FE 衡 因子 (balance factor) 


FE 均 查 找 长 度 (Average Search Length， 
ASL) 图 (graph) 


前 级 编码 (prefix code) 拓扑 排序 (topological sort) 


特殊 矩阵 (special matrices) 
同义词 (synonym) 
同义词 冲突 (synonym collision) 
头 结 点 (head node) 


头 指 针 (head pointer) 

















强 连 通 分 量 (strongly connected weight) 拓扑 序列 (topological order) 








强 连通 图 (strongly connected graph) 外 部 排序 (external sorting) 
入 度 (in-degree) 完全 二 又 树 (complete binary tree) 








关键 字 

完全 图 (complete graph) 

网 (network) 

伪 随 机 探测 (random probing) 

稳定 的 排序 法 (stable sorting method) 
无 向 图 (unorder graph 或 undigraph) 
物理 结构 (physical structure) 

希 尔 排序 (shell's method) 

稀 牙 和 矩阵 (sparse matrix) 

稀世 图 (sparse graph) 

先进 先 出 (First In First Out，FIFO) 
先 序 遍历 (preorder traversal) 

线索 二 义 树 (threaded binary tree) 
线索 链表 (threaded linked list) 

线性 表 (linear list) 

线性 链表 (linear linked list) 

线性 探测 (linear probing) 

选择 排序 (selection sort) 
循环 队列 (circular queue) 

循环 链表 (circular linked list) 





有 向 图 (digraph)(directed graph) 

有 向 无 环 图 (directed acycline graph) 
有 序 树 (ordered tree) A 
原子 类 型 (atomic data type) 

再 哈 希 (rehash) \ 

栈 (stack) 


附录 “关键 词 索引 


栈 底 (bottom) 

栈 项 (top) 

折 半 插入 (binary insertion sort) 

折 半 查找 (binary search) 

折 和 三 法 (folding method) 

直接 插入 排序 (straight insertion sort) 





直接 定 址 (immediate allocate) 
直接 后 继 (immediate successor) 
直接 前 趋 (immediate predecessor) 
指针 (pointer) 
中 序 遍 历 (inorder traversal) 
主 关键 字 (primary key) 
装填 因子 (l6ad factor) 
子 串 (Substrinig) 
子 树 Gubtrea) 
子 耻 (descendanb) 
子 图 (subgraph) 
祖先 (ancestor) 
最 次 位 优先 (Least Significant Digit 
first, LSD) 
最 短路 径 (shortest path) 
最 主 位 优先 (Most Significant Digit 
first, MSD) 
最 小 生成 树 (minimal spanning tree) 
最 优 二 又 树 (optimal binary tree) 
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